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LEXIQUE DE MATHÉMATIQUES 


SUPPLÉMENT AU VOLUME XIII DE LA GRANDE ENCYCLOPÉDIE 
ALPHA DES SCIENCES ET DES TECHNIQUES 


ABRÉVIATIONS 


adi. adjectif 
ex. exemple 


A 


absorbant. adj. Un élément a d'un ensemble E 
muni d'une loi T est absorbant si, pour tout b appar- 
tenant à E, aTb=bTa= 


accumulateur. n. Registre de l'U.A.L. (unité arith- 
métique et logique) dans lequel sont placés les 
résultats de la plupart des opérations élémentaires. 


adhérent. adj. Tout point qui appartient à l'adhé- 
rence (ou fermeture) d'une partie À d'un espace 
topologique est dit point adhérent à A. 


adresse. n. Numéro du registre mémoire ou mot 
mémoire contenant une information et permettant 
d'accéder à celle-ci. 


aléatoire. adj. Soumis au hasard. 


aléatoire. adj. (fonction). Se dit d'une fonction 
F telle que sa valeur F (x) dépend du résultat du 
tirage d’une ou plusieurs variables aléatoires. 


aléatoire. adj. (variable). Soit 6 un espace des 
événements possibles. Soit X une application de 6 
sur R, telle que l'image inverse par X de tout intervalle 
de R soit un élément de E, tribu associée à 6. X est 
dit variable aléatoire définie sur l'espace probabili- 
sable (6, E). On dit que X est une variable aléatoire 
purement discrète si la réalisation des événements 
non nuls de 6 ne peut conduire qu'à une série dis- 
crète de valeurs x» € R, et absolument continue sur 
l'intervalle non nul [a, b] ER si aucun point de cet 
intervalle ne correspond à la réalisation d'un événe- 
ment impossible. 


algébrique. adj. (entier). Racine d'un polynôme 
à coefficients entiers, dont le coefficient du terme 
de plus fort degré est égal à 1. EX. : : 2 (racine de 
x2— 2). 


algébrique. adj. (extension). Se dit d'une exten- 
sion simple K (/) d'un corps K, telle qu'il existe au 
moins un polynôme non nul f (x) à coefficients dans K 
admettant / pour racine : f (/) = 


algébrique. adj. (nombre). Racine d'un polynôme 


J 
à coefficients entiers. Ex. : 5 (racine de 3 x? — 2). 


analytique. adj. (fonction). Se dit d'une fonction 
dont le développement en série de Taylor converge 
vers la valeur de la fonction (voir ho/omorphe). 


anneau. n. Un ensemble À muni de deux lois de 
composition interne (une addition et une multipli- 
cation) est un anneau si : 

1° A est un groupe abélien pour l'addition; 

2° la multiplication est associative; 


n. nom 


par ext. par extension 


3° la multiplication est distributive par rapport à 
l'addition. 


anneau intègre. Un anneau A est dit intègre ou 
anneau d'intégrité s'il n'existe pas d'éléments x, y 
de A différents tous deux de O, tels que xy = 0. 


application (d’un ensemble dans un autre 
ensemble). Relation telle que tout élément de l'en- 
semble de départ ait une image et une seule. 


archimédien. adj. (corps). Qualifie un corps 
ordonné K dans lequel la propriété suivante est 
vérifiée : Pour tout couple (a, b) d'éléments de K 
strictement positifs, il existe un entier n tel que 
nb> a. 


assembleur. n. Programme destiné à traduire en 
langage machine binaire un programme écrit en 
langage machine symbolique. 


axiomatisation. 7. La méthode axiomatique est au 
principe de toute mathématique rigoureuse. Bien 
avant d'avoir été employée avec une maîtrise par- 
faite dans les É/éments d'Euclide, elle a été abon- 
damment décrite par Platon et par Aristote. Mais 
alors il ne s'agissait que de poser des énoncés pri- 
mitifs et d'en dériver d’autres qui « consonnent » 
ou « s’harmonisent » avec eux. Autrement dit, il 
s'agissait d’une bonne approche de l'idée de déduc- 
tion purement logique. Mais le caractère des 
énoncés primitifs était laissé dans l'ombre et prêtait 
à des confusions; on a beaucoup discuté sur le fait 
que ces énoncés étaient des vérités primitives au 
sens d'évidences premières accessibles à l'expé- 
rience immédiate, ou des conventions, ou des défi- 
nitions. Depuis la fin du XIX® siècle, la généralisation 
de la méthode axiomatique a permis la mise en 
lumière de principes ensemblistes sous-jacents aux 
différentes disciplines mathématiques. Il a fallu 
axiomatiser la théorie des ensembles qu'on a ainsi 
trouvée au principe de toutes les mathématiques, ce 
qui conduit à la découverte des fameux paradoxes. 
L'application de la méthode axiomatique à la théorie 
des ensembles dut alors passer pour le principe des 
définitions implicites (on renonce à définir directe- 
ment la notion d'ensemble implicitement définie par 
l'ensemble des axiomes) inhérent à la méthode 
axiomatique moderne inaugurée par Hilbert dans 
les Fondements de la Géométrie et caractérisée par 
le fait que les notions primitives, telles que point, 
droite, plan, sont des objets sans contenus intuitifs, 
définis pour les seules relations réciproques posées 
sous forme d'axiomes. 


axiome de choix. L'’ « axiome de choix », qui doit 
son nom au mathématicien Zermelo, dit que si £ est 
une famille d'ensembles disjoints et non vides, il est 
toujours possible de choisir dans chacun des mem- 
bres de la famille un élément unique et de réunir tous 
les éléments ainsi distingués en un ensemble bien 
défini. En termes plus mathématiques, l'axiome 


p. ex. par exemple 


syn. synonyme 


énonce que le « produit cartésien » des membres de 
la famille £ n’est pas vide, c'est-à-dire que parmi les 
sous-ensembles de l'ensemble Ué obtenu en réunis- 
sant tous les éléments de tous les membres de #, il 
y à au moins un sous-ensemble dont l'intersection 
avec chacun des membres de # est constituée par 
un élément unique. 


B 


base. n. Partie libre et génératrice d'un espace 
vectoriel. Tout espace vectoriel admet des bases. 


base d’un système de numération. Nombre de 
symboles utilisés pour représenter un nombre dans 
ce système. 


bidual. nr. Soit E un espace normé et E’ son dual 
topologique; on appelle bidual de E l'espace E”, 
dual topologique de E’ muni de la topologie forte. 


bijection. n. Application telle que son application 
réciproque est aussi une application. 


bilinéaire. adj. (forme). Se dit d'une application 
de E x E (où E est un espace vectoriel) dans son 
corps de base K, linéaire par rapport au premier et 
au deuxième arguments. 


binaire. adj. (additionneur). Se dit d'un circuit 
électronique réalisant l'addition en base 2 


binaire. adj. (système). Se dit d'un système de 
numération en base 2, c'est-à-dire utilisant les seuls 
symboles 0 et 1. 


bistable. n. Voir flip flop. 


bit. n. Chiffre binaire (de l'anglais binary dig/t) ; par 
ext. signal logique. . 


bon ordre. Un ensemble est muni d'un bon ordre 
si toute partie non vide de cet ensemble admet un 
plus petit élément. 


bornée. adj. (partie). Qualifie une partie d'un 
espace métrique contenue dans une boule de rayon 
fini. 


borne inférieure. On appelle borne inférieure 
d'une partie d’un ensemble ordonné le plus grand 
des minorants de cette partie. 


borne supérieure. On appelle borne supérieure 
d'une partie d'un ensemble ordonné = plus petit des 
majorants de cette partie. 


boucle. n. En informatique, séquence d'instructions 
exécutée plusieurs fois de suite. 


boule. n. L'ensemble des points d'un espace métri- 
que E, dont la distance à un point a € E est inférieure 
à un nombre r > O (respectivement inférieure ou 
égale) est dit boule ouverte (respectivement fermée) 
de centre a et de rayon r. 


C 


calcul infinitésimal. Inventé simultanément et 
indépendamment par Newton et Leibniz, le calcul 
infinitésimal a soulevé bien des difficultés avant que 
ne fût éclairci (au XIX® siècle) le concept de /imite, 
puis rigoureusement défini celui de nombre réel 
(voir le chapitre Histoire des Mathématiques). Cette 
expression, aujourd'hui vieillie et remplacée par le 
terme analyse (héritage de l'expression analyse 
infinitésimale due à Euler et très répandue au siècle 
dernier), désigne l’ensemble des méthodes du calcul 
différentiel, du calcul intégral et du calcul des 
variations. 


canonique. adj. (analyse). L'analyse canonique 
est une méthode statistique de traitement de 
données multidimensionnelles, qui consiste à étudier 
les relations entre deux groupes de variables. 


caractéristique universelle. Ce concept leib- 
nizien désigne l'art d'exposer les pensées au 
moyen d'un ensemble de signes et d'expressions qui 
en rendent possible et aisée la manipulation par les 
ressources du calcul. 


cardinal. n. Deux ensembles ont même cardinal 
s'il existe une bijection de l’un sur l'autre. Pour un 
ensemble fini, le cardinal est le nombre d'éléments 
de cet ensemble. 


catégorie. n. Un ensemble C muni d'une loi de 

composition interne (notée +) associative est une 

catégorie si : 

1° il existe deux applications x et & de C dans une 

partie Co de C telles que la restriction de x et & à Co 

soit l'identité; - 

2° le composé g < f de deux éléments de C est 

défini si et seulement si x (g) = & (f); on a alors: 
a(gof)=x(f) et B(gof) = 8£ (g): 

3° pour tout élément f de C,on a: 

fou(f)=f=8(f)of. 


Cauchy (suite de). Si une suite (x:) appartient à 
un espace métrique (E, d), elle est dite de Cauchy si 
pour touts > Oil existe un entier p tel que dès que n 
et m sont des entiers supérieurs à p, on ait : 
d'(XnXm) < €. 


centrée. adj. (variable aléatoire). On dit que la 
variable aléatoire X est centrée si l'espérance mathé- 
matique de X est nulle : E (X) = ©. 


cercle. n. Le cercie est, dans le plan, le lieu des points 
situés à une distance constante d'un point fixe. 
L'équation dans un système orthonormé d'un cercle 
de centre (x, &) et de rayon 7 est : 

(re a) (UE re 


chaîne. n. Une combinaison linéaire à coefficients 
entiers de p-simplexes singuliers est appelée 
p-chaîne ou chaîne p-dimensionnelle. 


‘chargeur. n. Programme destiné à charger en mé- 
moire d'autres programmes. Parfois appelé éditeur 
de liens. 


circulaire. adj. (fonction). Une fonction circulaire 
directe mesure un segment en fonction d'un angle, 
tandis qu'une fonction circulaire inverse mesure un 
angle en fonction d'un segment. 


clan. n. Famille de parties d’un ensemble stable pour 
les opérations de réunion et de passage au complé- 
mentaire (donc aussi d'intersection). 


code. n. Ensemble de symboles et de règles d'utilisa- 
tion de ces symboles pour représenter des informa- 
tions de façon conventionnelle. 


codimension. n. Soit E un espace vectoriel. On dit 
qu'un sous-espace F est de codimension finie s'il 
admet un supplémentaire G dans E qui soit de dimen- 
sion finie. Et l'on pose : 

codim F = dim G. 


col. n. Voir minimax. 


compact. adj. Un espace topologique E est dit 
compact si, de tout recouvrement ouvert de E, on 
peut extraire un recouvrement fini; il est dit locale- 
ment compact s'il est séparé et si chacun de ses 
points possède au moins un voisinage compact. 


compilateur. n. Programme destiné à traduire en 
langage machine binaire un programme écrit dans un 
langage évolué. 


complément à deux. Mode de représentation des 
nombres négatifs. Dans une représentation à n bits, 
le nombre — N (N > O) est représenté par 2° — N. 


complémentaire (d'une partie dans un ensem- 
ble). Soit À une partie de l'ensemble E; l'ensemble 
des éléments de E qui n’appartiennent pas à À est 
le complémentaire de À dans E, noté C£ ou E— A, 


complet. adj. Un espace métrique E est dit complet 
si toute suite de Cauchy de points de E admet une 
limite dans l'espace E. 


complexe. adj. (nombre). Se dit d'un nombre du 
type a + bi où a et b sont des nombres réels et / une 
racine du polynôme x? + 1; a est la partie réelle, 
b la partie imaginaire. 


compteur ordinal. Registre de l'unité de contrôle 
contenant l'adresse de la prochaine instruction à 
exécuter pendant le déroulement d'un programme. 
Son contenu est mis à jour à chaque instruction. 


conforme. adj. (transformation). Transformation 
géométrique qui conserve les angles. Toute fonction 
d'une variable complexe, holomorphe, définit une 
transformation conforme. 


congru. adj. Si R est la relation d'équivalence 
définie sur Z par a ‘R b si et seulement si a — b est un 
multiple de k (k entier non nul), on dit que a est 
congru à b modulo k et on note : a = b (K). Ex. : 
5—= 23 (3): 


congruence. n. Relation d'équivalence particulière 
définie sur Z (voir congru). 


conique. nr. Les coniques sont les courbes obtenues 
par intersection d'un cône et d'un plan. En coordon- 
nées cartésiennes, ces courbes sont le lieu des points 
solutions des équations du second degré à deux 
inconnues. 


continuité. n. Une application f d'un espace topo- 
logique E dans un espace topologique F est continue 
en un point a€ E si f (x) admet f (a) pour limite 
lorsque x tend vers a. 


contractante. adj. (application). Soit f une appli- 

cation d'un espace métrique (E, d) dans un autre 

(F, d‘) et k un nombre strictement compris entre O 

et 1 (0 < & < 1). On dit que f est contractante si : 
Vx, YEeE, d'(f (x), f (y)) < kd (x y). 


contraction. 7. Opération qui consiste à égaler dans 
un monôme un indice de covariance et un indice de 
contravariance, en sous-entendant alors la somma- 
tion. Un tenseur mixte (m, p) devient alors un tenseur 
mixte (m—1,p—1). 


convention d'Einstein. Convention qui permet de 
sous-entendre une sommation dans un monôme 
lorsque celui-ci comporte un indice répété deux 
fois, une fois en tant qu'indice de covariance, une 
autre comme indice de contravariance. 


convergence. 7. On dit qu'une suite (x:) d'un 
espace métrique (E, d) converge vers un point 
1£&E (ou admet / pour limite dans E) si pour tout 
z > O, il existe un entier p tel que, dès que n est un 
entier supérieur à p, on ait d'(/, Xn) < =. 


convergence simple. Soit une suite /, de fonctions 
à valeurs dans un espace métrique F; on dira que la 
suite /, converge simplement vers f si : 

VxeË, V>0 mEeN 

Vn> m:d{fn (x), F(x)) < =. 
L'entier m ainsi déterminé dépend de = et de x. 


convergence uniforme. Mode de convergence 
d'une suite de fonctions, tel que la distance entre un 
élément f, de la suite et la limite devienne arbitraire- 
ment petite, mais indépendamment de la variable; 


pour tout = > O, il existe m tel que, dès que n > m, 
alors, et pour tout x, on a : d (fn (x), F (x)) < =. 


convexe. adj. (ensemble). Une partie À d'un 
espace vectoriel E est dite convexe si, toutes les 
fois que deux points a, b appartiennent à À, tout le 


segment (à, Ë] est contenu dans À : Ya, Be A, 
> > 
Ve [0,11 : xa + (1 — 2) bEA. 


convexe. adj. (figure). Se dit d'une figure géomé- 
trique telle que si deux points lui appartiennent, alors 
le segment qui joint ces points lui appartient. 


convolution. 7. Loi de composition définie entre 
fonctions localement intégrables sur un ensemble X 
par : 
; (£ g)kf.g 
où F.g(x) = [f(x— 6) g (t) dt. 
TZ 


coordonnées. n. 1° Coordonnées bipolaires. Les 
coordonnées bipolaires d'un point P d’un plan sont 
les deux distances de P à deux points fixes appelés 
« pôles » ou « foyers ». 2° Coordonnées cartésiennes. 
Un système de référence cartésien étant fixé dans 
le plan, les coordonnées cartésiennes d'un point P 
du plan sont les mesures des deux segments ayant 
pour extrémités d’une part l'origine, d'autre part le 
point d'intersection avec l’un des axes de la droite 
parallèle à l’autre axe et passant par P. 3° Coordon- 
nées elliptiques. Les coordonnées elliptiques d'un 
point P du plan dans lequel on a fixé deux foyers 
sont respectivement la somme et la différence des 
coordonnées bipolaires de P par rapport à ces deux 
foyers. 4° Coordonnées polaires. Si dans le plan est 
fixée une demi-droite orientée dont l'origine est le 


nn 
point O, munie d'un vecteur unitaire z les coordon- 
nées polaires d'un point P du plan sont la distance 


—r > — 
OP | et l'angle (4 OP). 


corps. 7. Un anneau sera appelé corps si ses 
éléments distincts du zéro de l'addition forment un 
groupe pour la multiplication. 


corrélation (coefficient de). Mesure du degré de 
liaison entre deux variables aléatoires X et Y. Il 
existe plusieurs définitions des coefficients de corré- 
lation (de Pearson, etc.); mais, sauf indication 
contraire, il s’agit du coefficient + défini pour tout 
couple X et Y admettant des espérances mathéma- 
tiques E (X) et E (Y) et des écarts types os (X) et 
c (Y), tels que : 

__ ELX—E(X) (Y—E ())] 

: s (X) s (Y) ù 


corrélation (fonction de). La fonction de corré- 
lation C (=) est la fonction de = formée par la cova- 
riance E (y (é) y (ét + =)) pour une fonction aléatoire 
stationnaire y (t). 


corrélées. adj. (variables aléatoires). Se dit de 
deux variables aléatoires X et Y telles que le coefficient 
de corrélation entre X et Ÿ soit différent de zéro. A 
distinguer de variables aléatoires /iées. 


correspondance. n. Soit E et F deux ensembles; 
on appelle correspondance de E dans F toute appli- 
cation de E—Ÿ (F) où Ÿ (F) est l'ensemble des 
parties de F. Une correspondance ® est générale- 
ment notée D:E—=F. 


correspondances (analyse des). Méthode parti- 
culière d'analyse factorielle. 


covariance. n. La covariance entre deux variables 
aléatoires X et Y est l'espérance mathématique, 
quand elle existe, du produit XY. 


cycle. n. Une chaîne p-dimensionnelle dont le bord 
est nul est elle-même un bord; on l'appelle p-cycle. 


D 


décimal. adj. (système). Qualifie le système de 
numération à base 10. 


définition imprédicative. Cette notion est 
apparue avec les paradoxes de la théorie des 
ensembles. On dit qu'un ensemble est défini de 
facon imprédicâtive si la définition renvoie à la 


totalité à laquelle l'ensemble appartient. En langage 
logique, une définition est imprédicative si elle 
définit un objet qui est une des valeurs prises par 
une variable liée occurente dans l'expression symbo- 
lique de la définition. Poincaré et Russell ont essayé, 
de différente facon, d'éviter les définitions impré- 
dicatives. 


dénombrable. adj. (ensemble). Se dit d'un 
ensemble équipotent à l'ensemble N des entiers 
naturels. 


dense. adj. Une partie À d'un espace topologique E 
est dite dense dans E si sa fermeture est égale à E. 


densité de probabilité. La densité de probabilité 
f(x), définie sur l'intervalle de définition de la 
variable aléatoire continue X, [a, b], a Æ b, est telle 
que : 

Prix< X &S x + dx) = f(x) dx 

(xE [a b]). 


densité de probabilité normale. La variable 
aléatoire X continue, définie sur (— 2%, + %), est 
normale si la densité de probabilité f (x) associée 
peut se mettre sous la forme : 


(x— xo)°? 
Fée 25 
6 V27 
où XER et se R:. 


dérivée. n. Soit | un intervalle de R et f une applica- 
tion de | dans R. Lorsque la limite du rapport : 
f (Xo + h) — f (xo) 
h 

existe pour h tendant vers O (avec x, € |), on dit que 
f est dérivable en xs. L'application qui, à tout xel, 
fait correspondre la limite obtenue s'appelle appli- 
cation dérivée ou dérivée de f. 


déterminant. 7. Sur un espace vectoriel E, seule 
forme multilinéaire alternée qui prenne la valeur + 1 
pour les vecteurs de la base canonique. 


dialectique. n. Au sens où on l'a utilisé dansletexte, 
ce terme, qui a eu droit à la plus grande fortune, dési- 
gne le discours par lequel on essayait de donner 
aux mathématiques le statut qui leur revient dans le 
« monde intelligible ». On lit souvent que la dialecti- 
que trouve son origine dans les discussions antiques 
dont Zénon, disciple de Parménide, nous a laissé le 
souvenir dans les fameux paradoxes associés à son 
nom. Mais, déjà avec Aristote, le terme dialectique 
déchoit des hauteurs platoniciennes : on l’applique 
aux syllogismes dont les prémisses ne sont pas 
nécessairement vraies. 


différence symétrique (de deux ensembles). 

C'est l'ensemble des éléments qui appartiennent à 

l'un seulement des deux ensembles, noté : 
AAB= [ (ANB). 


AUB 


différentielle. n. Application linéaire continue /, 
approximant la différence des valeurs prises par une 
fonction f (définie sur un ouvert de R*) en deux 
points, donc telle que ||f (x) — f (y) —/ (x—y) || 
soit négligeable devant |x — y||. 


dimension. 7. Toutes les bases d'un espace vec- 
toriel ont le même nombre d'éléments; ce nombre 
est appelé dimension de l'espace vectoriel. 


Dirac (distribution de). La densité de probabilité 
de Dirac 5 (x— x,) est la densité de probabilité 
associée à la variable aléatoire X continue sur 
(— ©, + 0) telle que Pr (X # x) = 0. Elle est 
définie par la propriété fondamentale de la distri- 
bution de Dirac : 


+00 
fr (x) 8 (X— xo) dx = y (x), 
— O0 


valable pour toute fonction y (x) à valeurs dans R. 
discriminante. adj. (analyse). Qualifie la méthode 


statistique de traitement de données multidimen- 
sionnelles à but explicatif ou prévisionnel. 


disjoints. adj. (sous-ensembles). Se dit de sous- 
ensembles dont l'intersection est vide. 


distance. n. Une distance d sur un ensemble E est 
une application de Ex E dans l’ensemble des 


nombres réels positifs ou nuls, telle que, quels que 
soient les points x, y et z appartenant à E, on ait : 
d(x yy=0<x= y; 
d'(x y) = d'(y, x); 
d'(x y) < d'(x z) + d'(zZ y). 
On dit encore métrique définie sur E. 


distribution. n. Soit {) l'espace vectoriel des fonc- 
tions à valeurs réelles définies sur R?, indéfiniment 
différentiables et à support compact. On dit qu'une 
suite (+) de D converge vers O dans l'espace T) 
si les supports des fonctions 5, sont contenus dans 
un même compact et si toutes les dérivées partielles 
successives convergent uniformément vers © sur 
R*. On appelle distribution tout élément T du dual 
topologique de l’espace Ÿ) muni de la topologie 
sus-indiquée. 


diviseur. 7. Dans un anneau, a est un diviseur de b 
s'il existe un élément k de l'anneau tel que b = ka. 
Ex. : dans 7, 3 est un diviseur de 12. 


dual. n. Ensemble des formes linéaires sur un espace 
vectoriel E; pour les opérations d'addition et de 
produit par un scalaire il possède une structure 
d'espace vectoriel. On le note E*. 


dual topologique. Soit E un espace vectoriel topo- 
logique. On appelle dual topologique de E l'espace 
E‘ des formes linéaires continues sur E. 


duale. adj. (base). Si (e;):er désigne une base 
d’un espace vectoriel E, les formes linéaires (ei)jer 
telles que ei (ei) = 0 sii Æ j et + 1 sii = j for- 
ment une base de E*, dite base duale de celle de E. 


E 


écart type. Racine positive de la variance. 


échantillon. n. L'échantillon {x1… x,} de taille n 
est le résultat du tirage de la variable aléatoire à n 
dimensions {X1..X,;}, telle que les variables 
aléatoires X; soient mutuellement indépendantes et 
soient régies par la même loi de probabilité. Le 
tirage répété n fois d'une variable aléatoire X de loi 
F (x) est donc une méthode possible pour la cons- 
titution d'un échantillon de taille n. 


éditeur de liens. Voir chargeur. 


effet Condorcet. Voici le texte de Condorcet où 
apparaît ce concept : « Supposons, en effet, toujours 
trois candidats, et que les électeurs soient au nombre 
de soixante; qu'il y ait vingt-trois voix pour l'ordre 
Pierre, Paul, Jacques; aucune pour l'ordre Pierre, 
Jacques, Paul; deux pour l'ordre Paul, Pierre, 
Jacques; dix-sept pour l'ordre Paul, Jacques, 
Pierre; dix pour l'ordre Jacques, Pierre, Paul et huit 
pour l'ordre Jacques, Paul, Pierre; (..). Les trois 
propositions adoptées par la pluralité seraient donc : 
— Pierre est préférable à Paul; 

— Jacques est préférable à Pierre; 

— Paul est préférable à Jacques. 

Et il est évident que ces trois propositions ne 
peuvent être vraies en même temps, puisque (...) 
de deux quelconques, admises ensemble, résulte 
nécessairement une conséquence contradictoire avec 
la troisième... (si bien que) l'élection donne un résultat 
absurde, ou plutôt elle n’en donne aucun, tandis que, 
suivant la méthode ordinaire, Pierre ayant vingt-trois, 
Paul dix-neuf et Jacques dix-huit voix, l'élection 
décide en faveur de Pierre. » 


Élée, éléates. Élée est une ville du sud de l'Italie, 
sur les bords de la mer Tyrrhénienne. Colonie pho- 
céenne, elle est la patrie des philosophes « éléates », 
Zénon et Parménide en particulier. 


élément neutre. Un élément e d'un ensemble E 

muni d'une loi de composition interne (notée T) 

est un élément neutre pour la loi T si, pour tout 

élément x de E, on a les égalités : 
xTe=eTx= x. 


élément symétrique. Si E est un ensemble muni 

d'une loi de composition interne (notée T) possé- 

dant un élément neutre e, on dira qu'un élément x’ 

de E est symétrique d'un élément x de E si : 
xTx' = x Tx=e. 


ellipse. n. C'est une conique dont l'équation peut 
se mettre sous la forme : 


ellipsoïde. n. C'est une quadrique qui peut se 
représenter par l'équation : 

x2 y? 

ap 


endomorphisme. n. Application linéaire d'un espace 
vectoriel dans lui-même. 


ensemble. ». Mot le plus général pour désigner un 
« groupement » d'objets; mais tout groupement 
d'objets n'est pas forcément un ensemble (voir 
axiomes de la théorie des ensembles). 


ensemble des parties d’un ensemble. C'est 
l'ensemble dont les éléments sont les parties de 
l'ensemble E considéré; il est noté Ÿ (E) et comprend 
les parties propres, la partie vide et la partie pleine. 


ensemble-quotient. Ensemble des classes d’équi- 
valence d'un ensemble E muni d'une relation d'équi- 
valence R; on le note E/R. Ex. : si E=ZetsiR 
est la congruence modulo 2, E/'R se réduit à deux 
classes : celle des nombres pairs et celle des nombres 
impairs. 


entier relatif (nombre). Nombre égal à un nombre 


entier ou à son opposé. 


entrées-sorties. Toutes les opérations d'échange 
d'information entre l'unité centrale et les organes 
périphériques en informatique. 


épistémologie. n. Ce terme est introduit en France 
au début du XX° siècle par Couturat dans le lexique 
qu'il joint à la traduction par Cadenat de l'ouvrage 
de Russell : An Essay of the Foundations of Geometry 
(1897). Couturat, inspiré par la philosophie kan- 
tienne, définit l'épistémologie comme la « théorie de 
la connaissance appuyée sur l'étude critique des 
Sciences ». Bientôt, Lalande et Robert consignent 
à peu près la même définition dans leurs dictionnaires 
respectifs, et Meyerson consacre l'usage définitif du 
terme en 1907 (dans « Identité et Réalité »). 

Après les Fondements de la Géométrie de Hilbert, 
les études épistémologiques se sont émancipées de 
toute autorité philosophique. L'idée même de 
«théorie de la connaissance » est critiquée, et l'esprit 
de système, banni du corps des sciences, ne peut 
plus sévir dans les études qui prennent les sciences 
pour objet (voir Critique, n° 308, janvier 1973, 
p. 53-66). 


équation. 7. Soit f et g deux applications d'un 
ensemble E dans un ensemble F. La relation : 

F (x) = g (x) 
s'appelle équation et tout élément x de E pour lequel] 
la relation est vraie s'appelle solution de l'équation. 
Résoudre l'équation, c'est déterminer l'ensemble K 
de toutes les solutions : 


K= {x|f(x) = g (x)}. 


équation différentielle. Soit E un espace vectoriel 
normé sur KR et f une application continue sur 


R * E à valeurs dans E. L'équation _ =f(ty) 
s'appelle équation différentielle du premier ordre. 
Une solution de cette équation est une application 
© dérivable sur un intervalle | de KR et telle qu'en 
tout point x de | l'on ait : 
go" (x) = f(x 9 (x)). 
Plus généralement, l'équation : 
Le Éd =1 :) 


d'y & dy 
(e F QE 7 ET 


s'appelle équation différentielle d'ordre n. 


dtr 


équation linéaire. Soit E et F deux espaces vecto- 
riels; on appelle équation linéaire toute équation de 


> > 
la forme : f(x) = Or où f est une application 
linéaire de E dans F. L 


équidécomposable. adj. Deux figures sont dites 
équidécomposables si on peut les décomposer en 
un même nombre de triangles respectivement égaux. 


équipotent. adj. Deux ensembles sont équipotents 
s'ils peuvent être mis en bijection. 


équivalence (classe d’). Sous-ensemble constitué 
par des éléments équivalents. 
équivalence (relation d'). Relation binaire 
réflexive, symétrique et transitive. 


ergodique. adj. (chaîne). Chaîne markovienne 
telle qu'il n'existe pas d'états qui ne puissent être 
atteints à partir d'un état initial quelconque. Si P 
est la matrice stochastique associée, de rang 
m x n, on a donc : 

VL 1<i<m; 

V, 1<j<n:; 


An e N* (Pt); # O. 
espace de Banach. Espace vectoriel normé complet. 


espace de Hilbert. On appelle espace de Hilbert 
un espace vectoriel E muni d'une forme bilinéaire 
symétrique dont la forme quadratique associée est 
définie positive ; cette forme quadratique définit une 
norme par laquelle l'espace E est complet. 


espace localement convexe. Un espace vectoriel 
topologique E est dit localement convexe si tout 
point admet un système fondamental de voisinages 
convexes. 


espace probabilisable. 6 est un espace probabili- 
sable s'il est un espace d'événements possibles tel 
qu'à tout élément e de 6 et à tout élément d’une 
tribu associée à 6 on peut associer une probabilité 
intrinsèque de réalisation. 


espace réflexif. On dira qu'un espace normé E 
est réflexif s'il est identique à son bidual E”!. 


espace vectoriel normé. Soit E un espace vec- 
toriel sur R. On appelle alors norme sur E toute 
> > 


fonction, notée x — ||x|, possédant les trois pro- 
priétés suivantes : 


CRE > > > 
1° [x|| > O pour x # 0; [0]] = 0. 
me . 
2° IAx|| = llxIL }e R. 
> >. >. > 
8° [x + yll < [xl + [ylil 
Si E est muni d'une telle norme, on l'appelle espace 


vectoriel normé. Un espace vectoriel normé est un 
espace topologique. 


espace vectoriel semi-normé. Un espace vec- 
toriel est dit semi-normé s'il est muni d'une famille 
de semi-normes (P:); € | ayant la propriété suivante : 
quel que soit l’ensemble fini J € I, il existe k tel que 
Px majore tous les P;, je. 


espace vectoriel topologique. On appelle espace 
vectoriel topologique un ensemble E muni d'une 
structure espace vectoriel sur R et, d'autre part, 


d'une topologie compatible avec la structure vecto- 
> 


> > > 
rielle, c'est-à-dire telle que l'addition x, y — x + y 
est continue de E ®@ E— E et que la multiplication 


> + ke 
}, x 2x est également continue de R @ E— E. 


espaces de Sobolev. Soit Q un ouvert de R; on 
appelle espace de Sobolev d'ordre 1 l'espace défini 
par : 


Hi (0) = luive Le (O2 e L? (0)... 


| 1 : . 
(44 ; | 
ss SPA e L? (9), 


LOM nSe joies Rte 

où x désigne la dérivée au sens des distributions 
î 

par rapport à xi. 

Plus généralement, on définit des espaces de 

Sobolev d'ordre n, en faisant intervenir les dérivées 

partielles successives d'ordre < n. 


espérance mathématique. Soit X une variable 
aléatoire. L'espérance mathématique E (X) de X est : 
E (X) = ZxF (x) 
î 


si X est une variable aléatoire discrète et F (x:) la 
loi de probabilité associée; ou bien elle est : 


rb 
E (X) = x f(x) dx 
si X est une variable aléatoire continue, définie sur 
l'intervalle [a, b], et si f (x) est la densité de proba- 
bilité associée. 


estimateur. 7. Soit {X1… X,} une suite de variables 
aléatoires mutuellement indépendantes et régies par 


la même loi de probabilité F; (x), cette dernière 
dépendant d'un paramètre «. On appelle estimateur 


PaY st " ” Ed 
an de x toute variable aléatoire «x = f (X1… X») 
telle que, si {x1… x} est un échantillon de taille n 


résultat du tirage de {X1… X:}, 2! = f(xX1.. Xn) 


puisse être considéré comme une valeur approchée 
de %. 


estimateur asymptotiquement sans biais. Esti- 
Fa 
mateur « d'un paramètre x tel que : 


a 
lim Ex) = «. 
n — © 


. —s . TS : 
estimateur sans biais. Estimateur «; d'un para- 
mètre « tel que : 


Va E (@) = «. 


explicative. adj. (variable). Variable intervenant 
dans les problèmes de régression; appelée aussi 
variable exogène. 


expliquée. adj. (variable). Variable intervenant 
dans les problèmes de régression; appelée aussi 
variable endogène. 


F 


face. n. Dans un p-simplexe S, on appelle face 
chacun des (p— 1)-simplexes formés par p—1 
sommets de S. Un p-simplexe possède donc p — 1 
faces. 


facteur. 7. Nouvelle variable résultant d'une analyse 
factorielle. 


factoriel. adj. (axe). Se dit d'un axe associé à 
un vecteur propre d'une matrice, étudiée par une 
méthode d'analyse factorielle. 


factorielle. adj. (analyse). Qualifie une méthode 
statistique de traitement de données multidimen- 
sionnelles. On distingue l'analyse en facteurs 
communs et facteurs spécifiques, l'analyse en compo- 
santes principales et l'analyse des correspondances. 


fermé. adj. Complémentaire d'un sous-ensemble 
ouvert dans un espace topologique. 


fermeture. n. La fermeture (ou adhérence) d'une 
partie À d'un espace topologique E est le plus petit 
fermé de E qui contienne A. 


finitisme de Hilbert. On appelle ainsi l'exigence 
de Hilbert, qui ne voulait admettre dans la théorie de 
la preuve (ou métamathématique) que des argu- 
ments finitistes, c'est-à-dire : 

1° qui ne considèrent que des collections finies 
d'objets où de fonctions bien définies, et donc dont 
on peut calculer univoquement la valeur; 

2° qui n'affirment l'existence d'aucun objet sans 
indiquer en même temps le moyen de le construire; 
3° qui ne parlent jamais de l’ensemble de tous les 
objets x d'une collection /nfinie (quand on dit qu'un 
théorème vaut pour tous ces x, cela veut dire seule- 
ment que pour chaque x, en particulier, on peut 
répéter le raisonnement qui l'établit en général). 


flip flop. nr. Circuit électronique à deux états per- 
mettant de mémoriser une information logique; 
appelé aussi bistable. 


foncteur. n. Un foncteur d'une catégorie C dans 

une catégorie C’ est une application F de l’ensemble 

C dans l'ensemble C' telle que : 

19 Fa (f)] = & [F (f)] et F [8 (f)] = 8 [F (f)]: 

2° si g .fest défini dans C, alors : 
F(gof)=F(g)0F (f). 


fonction. n. Relation telle que tout élément de 
l'ensemble de départ ait au plus une image. Si l'on 
réduit l’ensemble de départ à l'ensemble de défi- 
nition de la fonction, la fonction est alors une appli- 
cation. On utilise plutôt le terme fonction lorsque 
l'ensemble d'arrivée est R (fonction numérique) ou 
€ (fonction complexe). 


fonction convexe, concave. Soit f une application 
d'un espace vectoriel E dans R; on dit que f est une 


> > 
application convexe si Vx, yeE, Vie [0,1], on a 
l'inégalité : 


FOX+ (1—2) ÿ) <a C9 + (1—2) Fr (D. 
On dira qu'elle est concave si — f est convexe. 


fonction logique. Fonction ne pouvant prendre 
que deux valeurs, vrai ou faux, selon les valeurs des 
variables. 


forme bilinéaire définie positive. Une forme 
bilinéaire définie sur E x E (E espace vectoriel) est 
dite définie positive si : 

> > > 
1° B (X.0))> 0 Vxek: 

> > > > 
2 B(x x) =0—=x= 0. 


frontière. nr. On appelle frontière d'une partie A 
d'un espace topologique E l'intersection de l’adhé- 
rence de À et du complémentaire de l'intérieur de A: 


Fr (A=AN [À 


G 


galoisienne. adj. (extension). Se dit d’une exten- 
sion algébrique simple L d’un corps K telle que, si 
un polynôme de degré n, irréductible dans K, y admet 
une racine, alors il en possède n et s'y décompose 
donc en un produit de » facteurs irréductibles du 
premier degré. 


gaussienne. adj. (variable aléatoire). Une 
variable aléatoire X est dite gaussienne si elle est 
définie sur (— ©, + ©) et si la densité de probabilité 
associée est normale. 


génératrice. adj. (partie). Se dit d'une partie G 
d'un espace vectoriel E, telle que tout élément de E 
puisse s'obtenir comme combinaison linéaire d'élé- 
ments de G. 


gradient. n. Vecteur à n composantes et dont les 
coordonnées sont les dérivées partielles du premier 
ordre d'une fonction réelle définie sur un ouvert 


de Rx. 


groupe. 7. Un groupe est un ensemble G muni 
d'une loi de composition interne partout définie, et 
qui possède les propriétés suivantes : 

1° elle est associative; 

2° elle possède un élément neutre; 

3° tout élément de G admet un symétrique unique. 


groupe commutatif. Un groupe est commutatif 
(ou abélien) si sa loi de composition interne est 
commutative. 


groupe de substitutions. La théorie des groupes 
de substitutions ou, comme on dit aussi, de permuta- 
tions renvoie à la théorie de Galois dont on trouvera 
un bref résumé dans le chapitre Histoire des Mathé- 
matiques, au paragraphe consacré à l'algèbre au 
XIXE siècle. 


groupe quotient. Si H est un sous-groupe distingué 
d'un groupe G, l’ensemble quotient G/R, où R est 
la relation d'équivalence xRy si et seulement si 
x-ly € H, est un groupe pour la loi xy = xy (x désigne 
un élément de G/R, x un élément de G et xy le 
composé dans G de x et de y). Ce groupe est appelé 
groupe quotient de G par le sous-groupe distingué H. 


H 


hasard. n. Antécédent de tout événement ou de 
tout phénomène dont la manifestation ne peut pas 
être prédite à l'avance, soit par ignorance des causes 
présidant à sa réalisation, soit par indéterminisme 
fondamental. 


hiérarchique. adj. (classification). Se dit de la 
méthode statistique consistant à déterminer des 
classes sur un ensemble de données multidimen- 
sionnelles par un procédé itératif. 


holomorphe. adj. Qualifie une fonction dérivable 
de variable complexe. Toute fonction d'une variable 
complexe, holomorphe, est analytique et vice versa. 


homéomorphe. adj. Deux espaces topologiques 
sont homéomorphes lorsqu'il existe un homéomor- 
phisme de l'un sur l’autre. De tels espaces ont les 
mêmes propriétés topologiques. 


homéomorphisme. n. Bijection continue d'un 
espace topologique sur un autre espace topologique, 
telle que sa réciproque soit aussi une application 
continue. 


homologie (groupe d’). Ensemble des classes 
d'équivalence de p-cycles pour la relation : À = B, 
s'il existe une (p + 1)-chaïîne C, telle que A-B soit 
le bord de C. 


homologue. adj. Deux segments, deux angles 
appartenant à deux figures géométriques sont dits 
homologues s'il existe, entre les deux figures, une 
correspondance biunivoque qui les fait correspondre. 


homomorphisme d'anneaux. Une application f 
d'un anneau A dans un anneau À’ est un homomor- 
phisme d'anneaux si : 

= F(XE y)=" (0 + (y): 

— f(xy) = f(x) f (y) pour tous les éléments x, y 
de A 


homomorphisme de groupes. Une application f 
d'un groupe G dans un groupe G' est un homo- 
morphisme de groupes si : 

F (xy) = F (x) F (y) ; 
pour tout x, tout y appartenant à G (les lois internes 
de G et G’ étant notées multiplicativement). 


homotope. adj. Deux applications continues (ou 
arcs) f et g de l'intervalle [0, 1] dans un espace E 
sont dites homotopes s'il existe une « déformation 
continue de f sur g conservant les extrémités », 
H : [0,1] x [0,1] — E et telle que : 


{ H(& 0) =f(t) 
UH (& 1) = g (+). 


hyperbole. n. Une hyperbole est une conique dont 
l'équation peut se mettre sous la forme : 

x y? 

a b? L 


hyperboloïde à deux nappes. L'hyperboloide à 
deux nappes est une quadrique qui peut se repré- 
senter par l'équation : 


hyperboloïde à une nappe. L'hyperboloïde à une 
nappe est une quadrique qui peut se représenter par 
l'équation : 


hyperplan. n. Soit un espace vectoriel E. On appelle 
hyperplan de E tout sous-espace de E de codimen- 
sion 1. 


hypothético-déductif. adj. Une science est dite 
« hypothético-déductive » quand elle peut s'orga- 
niser en un ensemble d'énoncés dont un petit nombre, 
admis au titre d'hypothèses, permet, moyennant 
l'usage de règles déterminées, d'obtenir par des 
déductions plus où moins longues et complexes les 
autres énoncés. En ce sens, toute science hypothé- 
tico-déductive doit son caractère à l'application de la 
méthode axiomatique (voir ax/iomatisation). 


idéal. n. Un idéal à gauche d'un anneau A est une 
partie | de A vérifiant : 

— | est un sous-groupe du groupe additif de A; 
— pour tout élément x de À, xl = | (pour un idéal 
à droite, la seconde propriété devient 1x = 1). 


idempotent. adj. Dans un ensemble E muni d'une 
loi T, un élément a est idempotent pour la loiT si 
aTa = 4. 


image. n. Si f est une application linéaire d'un 
espace vectoriel E dans un espace vectoriel F, l'en- 
semble f (E) est appelé image de f et se note Im (f). 


imaginaire. adj. (nombre). Se dit d'un nombre 
complexe dont la partie réelle est nulle. Ex. : 
LV. y. 


inclusion. n. Relation entre deux ensembles, qui 
exprime que tout élément de l’un des ensembles (A) 


est aussi élément de l'autre ensemble (B); se note 
Ex. ? 
ACB<T[xEeA = xeB]. 


indépendantes. adj. (variables aléatoires). Se 
dit d'un ensemble de variables aléatoires {X+} x-1, x 
définies sur des espaces d'événements possibles 
61 … 6x telles que pour tous , j < N: 

Va: e Gi et 4€ Gi 

Pr (a: = a;) = Pr (a) Pr (a;). 


indexage. nr. Mode d'adressage consistant à ajouter 
à l'adresse spécifiée dans une instruction le contenu 
du registre d'index. On peut ainsi, dans une boucle, 
atteindre des adresses successives avec la même 
instruction en incrémentant ce contenu à chaque 
itération. 


indice. n. La valeur (entière) de l'intégrale : 
1 Fr dz 
Pr | Z— à 


représente le nombre algébrique de fois où la courbe 
tourne autour du point a, et s'appelle l'indice de a 
par rapport à la courbe +. 


indirect. adj. (adressage.) Se dit de la méthode 
d'accès à une information consistant à indiquer dans 
une instruction non pas l'adresse de l'information 
cherchée, mais l'adresse d'un mot contenant 
l'adresse de l'information. 


inductif. adj. (ensemble). Un ensemble ordonné 
E est inductif si toute partie totalement ordonnée de E 
admet un majorant. 


infini. n. ou adj. Dès sa naissance comme science 
déductive, la mathématique a rencontré la notion 
d'infini, sous diverses formes; on distingue tradi- 
tionnellement (depuis Aristote) l'infini actuel et l'in- 
fini potentiel. Jusqu'au XIX® siècle, seul ce dernier 
avait un statut mathématique : il désigne la possibilité 
de poursuivre indéfiniment un processus opératoire. 
Aristote pensait que les mathématiciens n'ont pas 
besoin de recourir à l'infini mais seulement à une 
grandeur finie aussi grande que nécessaire. Par 
infini « actuel » ou « en acte », on désigne un infini 
donné, un « être ». C'est pourquoi les premiers 
« actualistes » ont été des théologiens, critiques à 
l'égard de la doctrine d'Aristote qui ne permettait 
ni au monde ni à Dieu d'être infinis. Mathématique- 
ment, les totalités infinies actuellement données ont 
reçu droit de cité avec la création d'une arithmétique 
de l'infini. 


instruction. 7. Ordre d'exécution d'une opération 
élémentaire réalisable par le calculateur. 


intégrale. adj. (courbe). Famille de solutions d'une 
équation différentielle d'ordre n, définies implicite- 
ment et dépendant de n paramètres. 


intégrale de Lebesgue. Généralisation de la notion 
d'intégrale au cas de certaines fonctions pour les- 
quelles on ne peut définir une intégrale au sens de 
Riemann. 


intégrale de Riemann-Stieltjes. Forme linéaire 
continue pour la topologie de la convergence uni- 
forme, sur l’espace de Banach des fonctions numé- 
riques définies et continues sur un intervalle de R. 


intérieur. n. L'intérieur d'une partie À d'un espace 
topologique E est le plus grand ouvert contenu 
dans A. 


intérieur relatif. Soit E un espace vectoriel topo- 
logique et À une partie de E; on appelle intérieur 
relatif de A (et l’on note 7:A) l'intérieur de A considéré 
comme sous-ensemble de #, où Æ désigne la plus 
petite variété affine contenant À — étant muni de 
la topologie induite par celle de E. 


intersection. 7. Pour deux ensembles, désigne 
l'ensemble de leurs éléments communs; désigne 
également l’ « opération » qui associe à deux ensem- 
bles leur intersection, notée f. Ex. : 

xEeANB & [xeA et xeB]. 


irrationnel. adj. (nombre). Se dit d'un nombre 
qui ne peut pas être représenté par le quotient de 
deux nombres entiers. Ex. : 2, TA 


irréductible. adj. (fraction). Qualifie une fraction 
constituée par le quotient de deux nombres entiers 
premiers entre eux. 


isométrie. n. Correspondance biunivoque entre 
deux figures géométriques, telle que les segments et 
les angles déterminés par les points qui se corres- 
pondent soient égaux. Deux figures entre lesquelles 
il existe une isométrie sont dites isométriques ou 
égales. 


isomorphisme. nr. Un isomorphisme est un homo- 
morphisme (de groupes, d'anneaux, de corps) 
bijectif. 


L 


langage machine. Code binaire représentant les 
instructions utilisées par le calculateur. 


langage symbolique. Langage permettant d'écrire 
des programmes au moyen de symboles sans avoir à 
connaître le langage machine. 


libre. adj. (partie). Se dit de la partie d'un espace 
vectoriel dont aucun élément n'est combinaison 
linéaire des autres. 

liées. adj. (variables aléatoires). Variables 
aléatoires qui ne sont pas indépendantes. 


limite. n. Une application f d'un espace topologique 

E dans un autre espace topologique F tend vers la 

limite / quand x tend vers a par valeurs dans A 

(A & E), si pour tout voisinage W de / dans F il 

existe un voisinage V de a dans E tel que : 
f(VANA)EW. 


linéaire. adj. (application). Une application f 
d'un espace vectoriel E dans un espace vectoriel F 
(tous deux sur le même corps K) est dite linéaire si 
la propriété f (aX + bY) = af (X) + bf (Y) est 
vérifiée pour tous les éléments a et b de K et tous les 
éléments Xet Y de E. 


linéaire. adj. (forme). Application linéaire d'un 
espace vectoriel dans son corps de base. 


locale. adj. (notion ou propriété). Notion ou 
propriété topologique qu'il suffit de vérifier dans un 
voisinage de chaque point, et non de façon globale. 


logique du premier ordre et logique du second 
ordre. Une /ogique du premier ordre se caractérise 
par le fait qu'elle n'admet comme seules variables 
que les variables d'individus, tandis qu'au second 
ordre sont admises des variables de prédicat : on 
peut alors appliquer les quantificateurs non plus seu- 
lement à des variables d'individus mais à des 
variables de sous-ensembles, et considérer par 
exemple une relation , (qui est un certain sous- 
ensemble d'un produit cartésien d'ensembles donnés) 
ou une suite (Xx»):eN (qui, en tant qu'application 
d'un ensemble E dans N, est encore un certain 
sous-ensemble du produit E x N) comme des 
variables quantifiables. 


loi de composition externe. On appelle loi de 
composition externe entre éléments d'un ensemble Q 
(ensemble des opérateurs) et éléments d'un ensemble 
E une application de Q x E dans E. 


loi de composition interne. Une loi de composi- 
tion interne dans un ensemble E est une application 
d'une partie A de Ex E dans E. 1° Loi associative. 
Une loi de composition interne (notée T) partout 
définie sur un ensemble E est associative si, pour tous 
les éléments x, y, zdeE, on a: (xTy)Tz=xT 
(y T z). 2° Loi commutative. Une loi de composition 
interne (notée T) partout définie sur un ensemble E 
est commutative si, pour tous les éléments x y de E, 
on a l'égalité : 
XTy=7yTXx. 


loi de « participation mystique ». Cette loi est 
particulièrement efficiente dans les danses et les 
cérémonies rituelles des « primitifs ». La raison pro- 
fonde de ces cérémonies, pour ceux qui les célèbrent 
comme pour ceux qui y assistent, est, nous dit 
Lucien Lévy-Bruhl (/e Surnaturel et la Nature dans 
la Mentalité primitive, P.U.F., Paris, 1963, p. 129), 
la « communion, la fusion mystique qui les identifie, 
suivant les cas, avec l'ancêtre mythique ou totémique, 


homme-animal ou homme-plante, ou avec les 
“génies” des espèces animales et végétales, ou avec 
les ancêtres et les morts du groupe. » 


loi des trois états. A. Comte la définit de la façon 
suivante : « En étudiant ainsi le développement total 
de l'intelligence humaine dans ses diverses sphères 
d'activité, depuis son premier essor le plus simple 
jusqu'à nos jours, je crois avoir découvert une 
grande loi fondamentale, à laquelle il est assujetti 
par une nécessité invariable, et qui me semble être 
solidement établie, soit sur les preuves rationnelles 
fournies par la connaissance de notre organisation, 
soit sur les vérifications historiques résultant d'un 
examen attentif du passé. Cette loi consiste en ce 
que chacune de nos conceptions principales, chaque 
branche de nos connaissances passe successive- 
ment par trois états théoriques différents : l'état 
théologique, ou fictif; l'état métaphysique, ou 
abstrait; l'état scientifique, ou positif. En d'autres 
termes, l'esprit humain, par sa nature, emploie suc- 
cessivement dans chacune de ses recherches trois 
méthodes de philosopher, dont le caractère est 
essentiellement différent et même radicalement 
opposé : d'abord la méthode théologique, ensuite la 
méthode métaphysique et enfin la méthode positive. 
De là, trois sortes de philosophies, ou de systèmes 
généraux de conceptions sur l'ensemble des phéno- 
mènes, qui s’excluent mutuellement : la première est 
le point de départ nécessaire de l'intelligence 
humaine, la troisième son état fixe et définitif; la 
seconde est uniquement destinée à servir de tran- 
sition. » (Première lecon du Cours de Philosophie 
positive, éd. Hermann, 1975, Paris, p. 21.) 


M 


maïeutique. n. Il s'agit de l’art dont Socrate s'attribue 
(dans le Théétète de Platon) la spécialité et qui 
consiste à « accoucher » les esprits des pensées 
qu'ils contiennent à leur insu. 


majorant. ». Dans un ensemble ordonné E, un 
majorant d'un sous-ensemble À est un élément M 
de E supérieur ou égal à tous les éléments de A. 


markovienne. adj. (chaîne). Qualifie une chaine 
de variables aléatoires {x:1, … xx, … x} telle que 
xx (2 <k< n) soit indépendante de toutes les 
variables xi, / £ k, à l'exception de xx-1. 


matrice. n. Mode de représentation d'une applica- 
tion linéaire, par lequel on range dans un tableau une 
succession de vecteurs-colonne, images des vecteurs 
d'une base de l'espace de départ exprimés par leurs 
composantes dans une base de l’espace d'arrivée. 


matrice jacobiénne. Soit f une application définie 
sur un ouvert U de [Rr à valeurs dans R?, différen- 


> . 
tiable en un point a = (a1, … a) de U. La matrice 


ee 
bi associée à l'application linéaire Df (a) est définie 
par la relation : 
CRE 
bi = EPA (a) 
où (f)1<i<nr désigne la famille des composantes 
de f; une telle matrice est appelée matrice jacobienne 
> 


associée à f au point a. 


matrice de jeu. Matrice attachée à un jeu à deux 
personnes U dont l'élément U;; est l'utilité à laquelle 
conduit l'application par le joueur A de la stratégie 
A: et par le joueur B de la stratégie B;. 


maximal. adj. Un élément a d'un ensemble ordonné 
est maximal s'il n'’admet pas de majorant strict, 
autrement dit ss xX>a —= x= a. 


médiane. adj. (valeur). La valeur médiane de la 
variable aléatoire X admettant la densité de proba- 
bilité f (x) définie sur l'intervalle [a, b], est la 
valeur x, € [a, b] telle que : 


Ko b 1 
CEE CES 
a Xo 


mémoire centrale. Partie de l'unité centrale d'un 
calculateur constituée d'un grand nombre de 
registres (ou mots mémoires) destinés à stocker des 
informations; chaque mot mémoire est repéré par 
son adresse. 


méromorphe. adj. (fonction). Se dit d'une fonc- 
tion de variable complexe holomorphe sur un 
domaine D, à l'exception d’une partie de D sans 
points d’accumulation, formée par ses pôles. 


mesure de densité. Une fonction réelle continue et 
positive p définit une mesure dite de densité p par 
rapport à la mesure de Lebesgue, par : 
f — [f(x)p (x) dax. 
Si m est une mesure positive sur X et p une fonction 
positive localement intégrable sur X, l'application 
f — Îf:p:dmest dite mesure de densité p pour m. 
C'est la généralisation de la dérivation. 


mesure de Radon. Une mesure de Radon positive 
sur un ensemble X est une forme linéaire continue 
et positive sur l'espace vectoriel K, (X) des fonctions 
continues sur X, nulles en dehors d'un compact de X. 


méthode des moindres carrés. Méthode utilisée 
pour résoudre les problèmes de régression. On dis- 
tingue la méthode des moindres carrés ordinaire et 
la méthode des moindres carrés généralisée. 


métrique. adj. (espace). Se dit d'un ensemble 
muni d’une distance ou métrique. 


métrisable. adj. Se dit d'un espace topologique tel 
qu'il existe une métrique qui engendre sa topologie. 
On dit encore espace régulier. 


minimax ou col. n. U;, élément d'une matrice de 
jeu de rang m x n pour un jeu à deux personnes de 
somme nulle, est un minimax si : 

Ui < Ur, K=1,n 

Us > Ux, 1 = 1, m. 


minorant. nr. Dans un ensemble ordonné E, un 
minorant d'un sous-ensemble À est un élément m 
de E inférieur ou égal à tous les éléments de A. 


mode. n. Le mode de la variable aléatoire X admet- 
tant la densité de probabilité f (x) est la valeur x, 
si elle existe et si elle est unique, pour laquelle f (x) 
est maximum. 


moment. ». Le moment d'ordre n (ne N:) de la 
variable aléatoire X est l'espérance mathématique de 
la variable aléatoire X*. 


moyenne. adj. (valeur). La valeur moyenne de la 
variable aléatoire X est l'espérance mathématique 
de X. 


multinômiale. adj. (loi). La loi multinômiale de 
rang k est la loi de probabilité régissant le tirage 
répété n fois de la variable aléatoire discrète X 
pouvant assumer 4 valeurs distinctes. Si 7: est le 
nombre de résultats donnant la /-ème valeur x: de X, 
alors : 


ni 


n! 
Toi 4 


Pr (m1, … Nr) = 


où p: est la probabilité d'obtenir x: en un tirage et 
Em=n. 
i 


multiple. n. où adj. Dans un anneau, b est un 
multiple de a s'il existe un élément 4 de l'anneau tel 
que b = ka. Ex. : dans Z, 10 est un multiple de 5. 


N-0O 


norme. 7. Pour une variable aléatoire discrète, la 
norme N de la variable aléatoire est : 
N=2F (x) 
î 
où F (x:) est la loi de probabilité associée à X. Pour 
une variable aléatoire continue, définie sur l'inter- 
valle [a, b], la norme est : 
D 
N = f (x) dx 
va 


où f (x) est la densité de probabilité associée à X. 


noyau. n. Partie d'un espace vectoriel E dont tous 
les éléments ont une image, par une application 
linéaire f: E — F, égale au vecteur nul de F. 


optimum. n. Soit / une application de E dans R. 
Un élément x* de E sera dit optimum de f s'il est un 


maximum ou un minimum de la fonction c'est-à- 
dire : 

f(x) <f(x*) Vxe E (maximum) 

f(x) > f(x) Vxe E (minimum). 
Si E est un espace topologique et si l'une ou l'autre 
de ces propriétés a lieu dans un voisinage U de x*, 
on dira que l'on a affaire à un optimum local. 


ordonnance. n. Ordre sur les paires d'éléments 
d'un ensemble. 


ordre. n. Relation binaire sur un ensemble, réflexive, 
antisymétrique et transitive. Un ordre est total si 
deux éléments quelconques sont toujours compa- 
rables; sinon, il est partiel. 


orientable. adj. Qualifie une surface admettant une 
décomposition en triangles (gauches) orientés, 
telle que l’ensemble des orientations n'admette pas 
de « contradiction ». 


ouvert. adj. Qualifie un sous-ensemble d'un espace 
topologique tel que pour tout point de ce sous- 
ensemble il existe une boule ouverte ayant ce point 
pour centre, et contenue dans le sous-ensemble. 


P 


parabole. n. Une parabole est une conique dont 
l'équation peut se mettre sous la forme : 
y?—4cx= 0. 


paraboloïde elliptique. Le paraboloïde elliptique 
est une quadrique qui peut se représenter par 
l'équation : 

x2 2 
RUE = = 22 


b? 


paraboloïde hyperbolique. Le paraboloïde hyper- 
bolique est une quadrique qui peut se représenter 
par l'équation : 


5 = 22. 


partie (d'un ensemble). Soit E un ensemble; 
tout ensemble A tel que À € E est une partie de E. 


partition (d’un ensemble). Recouvrement d'un 
ensemble par des parties disjointes. 


période. n. On dit qu’une application / de R dans 

R admet la période T ou est périodique de période T 

ou encore est T-périodique si pour tout x réel on a: 
F(X+T) = f(x). 


périphérique. n. Organe extérieur à l'unité centrale 
et permettant à celle-ci d'échanger des informations 
avec le monde extérieur. 


plan. n. L'espace étant rapporté à un système ortho- 
normé, un plan est le lieu des points vérifiant une 
équation de la forme : ax + by + cz + d = 0. 


pleine. adj. (partie). La partie pleine d'un ensemble 
est cet ensemble lui-même. 


plus grand élément. Dans un ensemble ordonné 
E, un plus grand élément d'un sous-ensemble À est 
un élément de A supérieur ou égal à tous les élé- 
ments de À qui lui sont comparables. 


plus petit élément. Dans un ensemble ordonné E, 
un plus petit élément d'un sous-ensemble A est un 
élément de A inférieur ou égal à tous les éléments 
de A qui lui sont comparables. 


Poisson (loi de). Loi de probabilité F (n) associée 
à la variable aléatoire discrète X, définie sur N:, telle 
que : 


oùm=E(X)eR. 


premier. adj. (nombre). Se dit d'un nombre 
entier relatif n’admettant pas d'autres diviseurs que 
lui-même et l'unité. 


préordre (sur un ensemble). Relation binaire, 
réflexive et transitive. 


primitive. n. La fonction G dérivable en tout point 
d'un intervalle | est une primitive de la fonction g 
sur | si sa dérivée en tout point de | est égale à g. 


principe de récurrence ou d'induction com- 
plète. Ce principe dit que, si un ensemble d'entiers 
naturels S contient 0 et s’il contient n + 1 à chaque 
fois qu'il contient n, alors S coïncide avec l'en- 


semble N de tous les entiers naturels. 


probabilité intrinsèque. Grandeur objective carac- 
térisant un événement aléatoire, telle que la fréquence 
d'apparition de cet événement dans une suite 
d'épreuves répétées en soit une approximation. Par 
extension mathématique, on peut appeler probabilité 
toute application P d'un espace probabilisable 
(8,E) dans R: satisfaisant aux axiomes : 
Vae(& E) 0O<P(a)<1, P(6)=1 
et telle que pour tout couple d'événements exclusifs 
a, bE (6, E) : 
P(aUb)=P (a) + P (b). 


problème aux limites. Recherche des solutions 
d'une équation aux dérivées partielles, satisfaisant 
à une ou plusieurs conditions initiales (on dit encore 
problème de Cauchy). 


programme. n. Ensemble des informations (ins- 
tructions, valeurs numériques, réservations de zones 
mémoire pour stocker des données) nécessaires à la 
résolution d'un problème donné. 


propre. adj. 1° Sous-espace : partie d'un espace 
vectoriel formée par tous les vecteurs propres ayant 
la même valeur propre associée. 2° Va/eur, vecteur : 
un vecteur V colinéaire à son image par une applica- 
tion linéaire est dit vecteur propre de cette applica- 
tion; le rapport de colinéarité est dit valeur propre 
associée. 


propre. adj. (partie). Partie d'un ensemble qui 
n'est ni vide ni pleine. 


puissance du continu. Cardinal d'un ensemble 
équipotent à l'ensemble R des nombres réels. 


puissance d’un ensemble. Cardinal de cet 
ensemble. 


O-R 


quadrique. n. Les quadriques sont les surfaces 
décrites par des coniques situées dans des plans 
parallèles lorsque leurs sommets décrivent d'autres 
coniques. C'est le cas de toute surface dont l'équa- 
tion en coordonnées cartésiennes est du second 
degré en x, yetz. 


racine carrée du nombre a. Racine positive du 
polynôme X?— a, où a est un nombre réel positif; 


on la note ,/a. 


raisonnement indirect. Exprimé symboliquement 
par la formule : 
[Gr g) A (Gp 19)]- p. 

Il permet d'établir un énoncé p en montrant qu'à 
partir de la négation de p, on peut déduire des 
contradictions. Supposons, par exemple, qu'on 
veuille établir « qu'il existe un entier n ayant la pro- 
priété P. On partira de sa négation : « Aucun entier 
n n'a la propriété P. » Les contradictions qui s'en 
déduisent montrent « qu'il est faux qu'aucun entier n 
n'a la propriété P ». Jusqu'à ce point, les mathéma- 
ticiens de toute obédience acceptent la conclusion. 
Mais les intuitionnistes se séparent des classiques 
en refusant de passer de cette conclusion à la 
suivante : « Il existe un entier n qui a la propriété 
P », tant qu'on n'a pas effectivement exhibé ou 
« construit » un tel entier. Le raisonnement indirect 
est donc un type de preuve non constructive, 
acceptée sans problèmes seulement dans la mathé- 
matique classique. 


rang. n. Le rang d'une application linéaire, ou de sa 
matrice relativement à deux bases données, est la 
dimension du sous-espace image. 


rationnel. adj. (nombre). Se dit d’un nombre qui 
peut être représenté par le quotient de deux nombres 
entiers. 


rayon de convergence. Rayon du cercie du plan 
complexe tel qu'en tout point intérieur une série 
entière donnée soit convergente, et qu'en tout point 
extérieur elle soit divergente. On ne peut rien dire 
a priori du comportement de la série en un point de 
la circonférence de ce cercle. 


réciprocité. n. Propriété de la transformation de 
Fourier, telle que la transformation de Fourier est la 
réciproque de sa conjuguée. 


recouvrement. 7. Un recouvrement ouvert (res- 
pectivement fermé) d'un sous-espace F d'un espace 
topologique E est une collection d'ouverts (respec- 
tivement de fermés) de E tels que leur réunion 
contienne F. En d'autres termes, les sous-ensembles 
A1, …, An forment un recouvrement de l'ensemble E 
si leur réunion contient E. 


redondance. n. Caractérise une information for- 
mellement superflue. Pratiquement, elle peut être 
utilisée pour des raisons de sécurité. 


réduite. adj. (variable aléatoire). Soit X une 
variable aléatoire admettant une variance 6? (X). La 
variable aléatoire Y = X/02 (X) est la variable 
aléatoire réduite associée à X. 


registre. n. Association de piusieurs bistables per- 
mettant de stocker un mot ou un nombre binaire de 
plusieurs bits. 


registre d'adresse mémoire. Registre dans lequel 
est chargée l'adresse d'un mot mémoire pour y être 
décodée avant une opération de lecture ou d'écriture. 


registre de base. Registre dans lequel est chargée 
l'adresse de base d'une séquence d'instruction, en 
début de séquence, lorsque l'adressage dans le cal- 
culateur se fait par base et déplacement. 


registre de données mémoire. Registre pour 
lequel transitent toutes les informations échangées 
entre la mémoire centrale et d'autres parties du 
calculateur. 


registre d'’index. Registre dont le contenu est 
ajouté à l'adresse spécifiée dans l'instruction lorsqu'il 
s'agit d'un adressage indexé. 


registre d'instruction. Registre dans lequel est 
chargée l'instruction binaire pour y être décodée 
avant exécution. 


règlement. n. Résultat chiffré d'une partie (théorie 
des jeux). 


régression. 7. Méthode statistique consistant à 
« expliquer » une variable (régression simple) ou 
plusieurs (régression multiple) en fonction d'autres 
variables. 


régulière. adj. (chaîne). Chaine d'événements 
aléatoires dont la matrice stochastique P de rang 
m x nest telle que : 

(<i<m) WG (1</<n) 


ke N_ (P*): # 0 


relation (entre deux ensembles). Relation définie 
par un triplet (E, F, G) où E est l'ensemble de 
départ, F l'ensemble d'arrivée et G le graphe de la 
relation, c'est-à-dire l'ensemble des couples (de 
E x F) pour lesquels la relation est vraie. 


représentant (d’une classe d'équivalence). 
Un quelconque des éléments de cette classe. Le 
connaissance d'un représentant d'une classe suffit 
à déterminer celle-ci. 


résidu. r. Nom donné au coefficient du terme en 
1/z dans le développement en série de Laurent d'une 
fonction de variable complexe au voisinage d'un 
point singulier. 


résidu aléatoire. Variable aléatoire mesurant 
l'écart entre la variable à expliquer et une fonction 
préalablement choisie des variables explicatives. 


résoluble par radicaux. Propriété d'une équation 
algébrique selon laquelle ses racines s'expriment à 
l'aide des quatre opérations et de l'extraction de 
racines m-ièmes. 


réunion. ». Pour deux ensembles, c'est l'ensemble 
des éléments qui appartiennent à l’un ou à l’autre 
des ensembles. Ex. : 

..  X*EAUB < [xeA où xeB]. 
Désigne également |’ « opération » qui associe à 
deux ensembles leur réunion, notée U. 


rupture de séquence. Passage d'une instruction 
à une autre instruction qui n'est pas forcément 
située à l'adresse suivante. 


S 


semi-norme. ñn. Une semi-norme sur un espace 
vectoriel E est une fonction p : E— R+ ayant les 
propriétés suivantes : 


1° p (x) > 0; p (Ô) = 0 
2 px) = hp (HreR 


> > > > 
3° p(x + y) < p (x) + p (y). 
Une norme est une semi-norme. 


séparé. adj. Un espace topologique E est dit séparé 
si pour tout couple de points x et y de E il existe 
deux ouverts d'intersection vide, l'un contenant x 
et l’autre y. 


séquentiel. adj. (circuit). Qualifie un circuit élec- 
tronique logique, dont l'état dépend à la fois de l'état 
des entrées et des états précédents. 


série. n. Une série numérique est définie par une 
suite (ar) de nombres — avec n e N et par la suite 
(Sn) n EN telle que Sy = & + a1 + … a» pour 
tout pEe N (suite des sommes partielles). 


série entière. Une série entière est une série de 
fonctions dont le terme général est un monôme 
8r (Z— Z:)*; on dit que z, est le centre de la série. 


série de Fourier. Série trigonométrique associée à 
une fonction T-périodique Une des façons de 
l'exprimer est : 


en posant : 


signe, sens, dénotation. Selon F. de Saussure, un 
signe est un phénomène double où un signifiant 
(vocal, écrit, gestuel) est relié à un signifié qui est 
la contrepartie conceptuelle du signifiant. Le signifié 
d'un signe est solidaire d'une langue donnée, 
naturelle ou artificielle. 

Le sens, lui, est un contenu de pensée (voir les 
quelques indications sur Frege dans le texte Logique) 
essentiellement susceptible d'être traduit par d'autres 
signes dans une autre langue. Mais le sens d'une 
expression (suite de signes) ne se livre que de façon 
différentielle, c'est-à-dire par rapport à et en fonction 
du contexte de l'expression. L'analyse du sens d'une 
expression n'implique aucun renvoi du langage à 
quelque chose d'extérieur à lui et se maintient dans 
l'enceinte du discours. 

Mais le discours se rapporte aussi aux choses, 
réalités extralinguistiques, et ce rapport, désigné 
comme dénotation où référence, institue la question 
de la valeur de la vérité d'une expression. 


similarité (indice de). Indice de mesure de proxi- 
mité, utilisé dans les méthodes statistiques de classi- 
fication. 


similitude. n. Correspondance biunivoque entre 
deux figures géométriques, telle que deux segments 
homologues soient toujours proportionnels avec le 
même rapport k, appelé rapport de similitude. 


simple. adj. (extension). Se dit d'une extension L 
d'un corps K telle qu'il existe / € L tel que L soit le 
corps K (/) engendré par K et /. 


sous-anneau. n. Un sous-anneau B d'un anneau A 
est une partie B de A qui est elle-même un anneau 
pour les lois de A induites sur B. 


sous-corps. r. Un sous-corps L d'un corps K est 
une partie L de K qui est elle-même un corps pour 
les lois induites sur L de celles de K. 


sous-ensemble. n. Un sous-ensemble À de l'en- 
semble E est un ensemble tel que À & E (voir aussi 
partie d’un ensemble). 


sous-groupe. n. Si G est un groupe, une partie H 
de G est un sous-groupe de G si H est un groupe 
pour la loi induite de celle de G. H sera un sous- 
groupe de G si et seulement si la propriété suivante 
est vérifiée : sixeHetyeH, alors xy 1eH. 


sous-groupe distingué. Un sous-groupe H d'un 

groupe G est un sous-groupe distingué (ou inva- 

riant) de G si, pour tout élément x de G, on a : 
xHx1 = H, 


sous-programme. n». Partie de programme, pou- 
vant être exécutée plusieurs fois, à la suite d'appels 
pouvant figurer en n'importe quel point du pro- 
gramme. Le sous-programme n'est stocké qu'une 
fois, même s'il doit être exécuté plusieurs fois. 


spectre. n. Ensemble de toutes les valeurs propres 
d'une application linéaire. 


sphère. n. Une sphère est, dans l'espace, le lieu des 
points situés à une distance 7 constante d'un point 
fixe C (x, &, y). Son équation est : 

Le o)2 + (y— 8} + (—v sr. 


sphérique. adj. 1° Angle : angle plan que font deux 
tangentes à deux côtés d'un triangle sphérique en 
leur point d'intersection. 2° On désigne par excès 
sphérique la quantité dont la somme des angles 
d'un triangle sphérique dépasse celle des angles 
d'un triangle plan. 3° Un triangle sphérique est la 
partie d'une surface sphérique délimitée par trois 
arcs de grand cercle (chacun des arcs étant plus 
petit qu'un grand demi-cercle). 


stochastique. adj. (processus, modèle). Le 
calcul classique des probabilités s'applique à des 
épreuves où chaque résultat possible est un nombre. 
Cependant, bien des situations réelles relèvent de 
modèles aléatoires de nature plus complexe, par 
exemple l'évolution d'une population donnée en 
fonction du temps. 

— Une probabilité p est une application d'une 
classe 3 de parties d'un ensemble Q (93 ayant les 
propriétés d'une tribu), sur le segment fermé [O, 1] 
(la probabilité d'un événement certain est évidem- 
ment égale à 1). On appelle espace de probabilité 
le triplet (9, B, p). 

— Une variable aléatoire à valeurs dans Q; est une 
application (mesurable) d'un espace de probabilité 
(A, B, p) dans Q1 muni d'une tribu :. 

— Un processus stochastique est une famille de 
variables aléatoires, c'est-à-dire qu'à tout temps # 
est associée une variable aléatoire prenant ses 
valeurs dans un ensemble numérique. Un processus 
stochastique est ainsi une fonction aléatoire dont 
l'argument est le temps, dont le déroulement est à 
la fois irréversible et inéluctable. 


stratégie. n. Ensemble de règles déterminant la 
conduite d'un joueur, compte tenu de toutes les 
réactions possibles de l'adversaire (ou des adver- 
saires), jusqu'au règlement final de la partie. 


stratégie dominante. Stratégie Ax telle que, 
quelle que soit la stratégie B:; choisie par l'adversaire, 
elle ne conduise pas à un règlement inférieur à une 
autre stratégie A;. La matrice de jeu U de rang 
m x n est donc telle que : 

Vi <i<n) 

VG(1<j<m), Un > Ux. 


stratégie mixte. Manière de conduire un jeu telle 
que, au cours d'une série répétée de parties, la stra- 
tégie appliquée varie d'une partie à l'autre de facon 
aléatoire, la stratégie A; ayant une probabilité 
définie P; d'être appliquée. 


suite. ». En mathématiques, une suite est une appli- 
cation de l’ensemble N des nombres entiers naturels 
dans un ensemble quelconque E. Cette application 
associe à chaque entier n de un élément e 
(unique) de E d'où la notation : @0, ex, 2, .…, en, … 


suite de choix. Ce concept est dû à Brouwer. On 
le définira sur l'exemple simple des nombres naturels. 
Une suite « est obtenue par des choix successifs, 
tels qu'on puisse imposer au cours du processus 
des restrictions sur les choix ultérieurs. C'est donc 
une suite de couples (a:, Ri), où R:; représente les 
conditions sur les suites d'entiers; ces conditions se 


restreignent progressivement, c'est-à-dire que Rix 
implique Ri:h4. Les suites de choix ne sont pas 
des objets achevés; à chaque instant, on n’en 
connaît qu'un segment initial. 


supplémentaires. n. Sous-espaces vectoriels d’un 
espace vectoriel E n'ayant que le vecteur nul en 
commun et engendrant E par addition. 


sur-corps. 7. Un corps K est dit sur-corps d'un 
corps L si L est un sous-corps de K. 


symbolique. adj. (calcul). Méthode de résolution 
des équations de convolution partant du fait que la 
transformée de Laplace d'un produit de convolution 
est égale au produit simple des transformées. On 
change alors de structure algébrique de référence. 


système d'exploitation. Ensemble de programmes 
destinés à l'exploitation la plus facile possible du 
calculateur par le plus grand nombre possible d'uti- 
lisateurs, ceux-ci n'étant pas forcément des spé- 
cialistes du matériel utilisé. 


système fondamental de voisinages. Soit 
(Vi): une famille de voisinages d'un élément a 
d'un espace topologique E. On dit qu'il s’agit d'un 
système fondamental de voisinages si tout voisinage 
de a contient l’un des Vi. 


système de référence cartésien (dans le plan 
et l'espace). Un système cartésien est la donnée 
de deux (dans le plan) ou de trois (dans l'espace) 
droites orientées se coupant en un point O (origine), 
sur chacune desquelles est fixée un vecteur unitaire. 


système orthonormé. Un tel système est un sys- 
tème cartésien dans lequel les vecteurs unitaires 
sont de longueurs égales et les axes orthogonaux. 


T-U-V-W-Z 


table de vérité. Représentation des fonctions logi- 
ques par une table où figurent toutes les intersections 
de base et la valeur correspondante de la fonction. 


tableau de contingence. Tableau construit de 
telle sorte qu'à l'intersection de la ligne / et de la 
colonne / on trouve le nombre d'individus possédant 
à la fois les caractères / et /. Un tel tableau se prête 
généralement bien à une analyse des correspon- 
dances. 


temps réel. Mode d'utilisation d'un calculateur, tel 
que celui-ci travaille au rythme d'un phénomène 
extérieur pour acquérir des données concernant ce 
phénomène et les traiter au fur et à mesure qu'elles 
arrivent. : 

tenseur (en dualité). Un tenseur covariant d'ordre 
p sur un espace vectoriel E est une forme p-linéaire 
sur l'espace E. Un tenseur contravariant d'ordre q 
sur E est une forme g-linéaire sur l'espace dual E*. 


tensoriel. adj. (produit). Forme multilinéaire de 
plusieurs tenseurs, qui prend pour valeur le produit 
des valeurs prises par ces tenseurs. Le produit ten- 
soriel peut être contracté en opérant, par ex., une 
contraction d'indices sur les composantes du pro- 
duit. 


terme. n. En logique aristotélicienne, on désigne 
par là les éléments autres que la copule qui compo- 
sent la phrase type construite sur le moule : « Socrate 
est mortel »; dans cet exemple Socrate et mortel 
sont des termes; les termes sont donc les sujets ou 
prédicats des propositions. 

Au sens technique de la logique mathématique 
contemporaine, « terme » se définit par récurrence 
selon les règles (1) et (2) : 

(1) Une variable ou une constante est un terme; 
(2) Pour un symbole de fonction f et des termes #1, 
… tm, 1 (t1, .…. tm) eSt un terme (voirtexte Logique). 


théorème de Bolzano-Weierstrass. Il s'énonce 
comme suit : « Tout ensemble de nombres réels 
infini borné admet au moins un point d'accumula- 
tion », ou encore : « De toute suite de réels bornée 
on peut extraire au moins une suite partielle conver- 
gente. » La démonstration de ce théorème fonda- 
mental de l'analyse repose sur la loi du tiers exclu, 
et c'est pourquoi il tombe sous la critique des 
intuitionnistes. 


théorème de Zorn. Théorème dont l'énoncé est 
le suivant : tout ensemble ordonné inductif admet un 
élément maximal. 


théorie de la connaissance. On appelle ainsi 
toute théorie philosophique qui s'interroge sur la 
nature et la portée de la connaissance humaine, sur 
son degré d'objectivité et la mesure dans laquelle 
nous pouvons ajouter foi à ce qu'elle prétend nous 
apprendre sur la réalité. En demandant ce qu'est la 
connaissance, par opposition à la croyance et à 
l'opinion, et en mettant en doute l'apport des sens, 
Platon a élaboré la première théorie de la connais- 
sance. 


théorie de la réminiscence. C’est la plus vieille 
théorie qui correspond à celle, plus moderne, de l'a 
priori. Partant de l'impossibilité de donner une expli- 
cation expérimentale satisfaisante et cohérente aux 
vérités mathématiques et, de manière générale, à 
toutes les propriétés intelligibles, Platon établit cette 
doctrine pour montrer que la mathématique n'est 
que la reproduction ou la répétition assourdie de 
souvenirs, la réeffectuation d'un savoir mathéma- 
tique séparé du monde sensible, inaccessible aux 
contingences du devenir et du temps. 


théorie des « visions du monde ». Le terme 
allemand, dû à Dilthey, est « Weltansehbauungen ». 
Dilthey pense que l'homme a une indéracinable 
tendance à forger des interprétations globales de la 
réalité, des « visions du monde », c'est-à-dire des 
systèmes plus ou moins cohérents d'idées et de 
représentations, de principes éthiques et d’expres- 
sions religieuses et artistiques. Ces systèmes, sub- 
jectifs et relatifs, constituent néanmoins un aspect 
authentique de la vie. 


topologie. n. Un ensemble E est muni d'une topo- 
logie si on a défini sur E une famille de parties, 
appelées parties ouvertes, vérifiant les propriétés 
suivantes : 

— Eet z sont des ouverts; 

— toute réunion (finie ou infinie) d'ouverts est un 
ouvert; 

— toute intersection finie d'ouverts est un ouvert. 


topologie affaiblie du primal. On appelle topo- 
logie affaiblie de E la topologie d'espace vectoriel 
définie par la famille de semi-normes : 


Pa, () = sup |<e', e >| S'eA 
A’ partie finie de E’. 


topologie faible du dual. On appelle topologie 
faible de E’ la topologie d'espace vectoriel semi- 
normé, définie par la famille de semi-normes : 


Pa (') = sup |<e, e’ >le€eA 
A partie finie de E. 


topologie forte du dual. Soit E un espace vectoriel 
normé, E’ son dual topologique. On appelle topo- 
logie forte du dual la topologie définie par la norme : 
< < > > 

e‘| = supl<e',e>| lle < 1. 
transcendant. adj. (nombre). Nombre qui n'est 
racine d'aucun polynôme à coefficients entiers; e, 7 
sont des nombres transcendants. 


transcendante. adj. (extension). Extension simple 
K (/) d'un corps K telle qu'aucun polynôme non nul 
à coefficients dans K n'admette / pour racine. 


transfini. adj. (nombre). Cardinal d'un ensemble 
contenant un ensemble équipotent à l'ensemble N 
des entiers naturels. : 


tribu. n. Famille de parties d'un ensemble, formant 
un clan, telle qu'une réunion dénombrable de parties 
soit encore dans la famille. 


ultramétrique. n. Distance (ou métrique) parti- 
culière utilisée en classification. 


union (de deux ensembles). Voir réunion. 


unité arithmétique et logique. Ensemble de 
circuits réalisant les opérations de types arithmé- 
tique et logique. 


unité centrale. Constituée de l'unité arithmétique 
et logique, de l'unité de contrôle et de la mémoire 
centrale, elle constitue un ensemble indépendant 
pouvant exécuter des programmes. Elle communique 
avec le monde extérieur par les périphériques. 


unité de contrôle. Ensemble de circuits assurant 
le bon déroulement des opérations. L'unité de 
contrôle reçoit les instructions une à une, les décode 
et les fait exécuter. 


utilité. 7. Règlement d'un jeu tel qu'une transforma- 
tion linéaire appliquée à l'ensemble des règlements 
n'affecte pas la conduite des joueurs. 


valeur absolue (d’un nombre réel). x étant un 
nombre réel, on appelle valeur absolue de x et on 
note |x| le nombre réel positif égal à x si x est positif 
et à — x si x est négatif. 


variance. 7. Soit X une variable aléatoire. On appelle 

variance 6? associée à X l'espérance mathématique 

du carré de la variable centrée correspondante : 
= E(X—E (X))2. 


NOTE RELATIVE AU GÉNÉRIQUE DU VOLUME XII 


Ont collaboré à ce volume : 


M. BELLEC, pour les ensembles, les nombres. 


vide. adj. (ensemble ou partie). C'est l’ensemble 
qui n'a aucun élément, noté z. Ex. : Vx, x € &. La 
mathématique n'a pas horreur du vide : on rencontre 
souvent l'ensemble vide, mais il n’y en a qu'un. 


voisinage. n. Toute partie d'un espace topologique 
Ë contenant au moins un ouvert contenant lui-même 
un point a € E est dite voisinage de a. 


M. BELLEC et C. PARDOUX, pour l'analyse de données. 
B. GOLDFARB et J. THÉPOT, pour l'introduction aux mathématiques. 
B. GOLDFARB, pour l'algèbre linéaire, les équations algébriques, l'analyse, le calcul tensoriel. 


R. HARA, pour le langage ensembliste. 


R. LESTIENNE, pour statistiques et probabilités. 


C. PARDOUX, pour la géométrie, la trigonométrie, la topologie, les courbes et surfaces. 


Y. RIO, pour l'introduction à l'informatique. 


H. SINACEUR, pour mathématiques et philosophie. 


À. et H. SINACEUR, pour logique. 


A. SINACEUR, pour mathématiques et société, 


mathématiques et pédagogie, histoire des mathématiques. 
C. SOFFER-SACOTTE, pour les structures algébriques, la géométrie analytique. 
J. THÉPOT, pour l'analyse combinatoire, les graphes, l'analyse fonctionnelle, 
le calcul numérique, les mathématiques financières 


ERRATA 


Page 39, dans le paragraphe « la divi- 
sibilité », 6° et 7° lignes, lire : — il 
existe dans Z un élément neutre 
pour la multiplication, le nombre 1, 
tel que 41 = 13 = a. 


et les mathématiques économiques. 


Page 181, légende en bas, lire : 


v Figure 10: distribution de proba- 
bilité d'observer en une seconde, 
k désintégrations d’une substance 
radio-active subissant en moyenne 
10 désintégrations par seconde. 


. SYMBOLES 
MATHÉMATIQUES USUELS 


implique EAE différence symétrique de deux en- 
équivalent à sembles 


AU 


ÿ quel que soit. (ou : pour tout...) Ca F complémentaire de F dans E 
= RAP AUBIN OR T(E) ensemble des parties d”’ ble E 
RVS disjonction (R ou S) P SHMENSEMENE 
RAS conjonction (R et S) 
TA négation (non R) 
[a, b] intervalle fermé d'origine a RELATIONS 
d'extrémité b_ : x = y (mod. R) x congru à y modulo R 
Ja, b] intervalle semi-ouvert à gauche E/R ensemble quotient de l'ensemble E 
[a, bT intervalle semi-ouvert à droite par la relation d'équivalence R 
Ja, bI intervalle ouvert & < relation d'ordre 
<, € relation d'ordre strict 
ENSEMBLES DE NOMBRES x SR y x est lié à y par la relation R 
N ensemble des entiers naturels f:xk f(x) x a pour image f (x) par l’applica- 
N * ensemble des entiers naturels, 0 tion f 
exclu | FE F application f d’un ensemble E dans 
D ensemble des nombres décimaux ouE À F un ensemble F 
Q. ensemble des nombres rationnels Id E application identique de E 
Q pe des nombres rationnels, F1 application réciproque de l‘appli- 
5 cation f 
R ensemble des nombres réels fog composé des applications f et g 
R* ensemble des nombres réels, O exclu (F rond g) 
C ensemble des nombres complexes 
SYMBOLES DE LA THÉORIE AUTRES SYMBOLES 
DES ENSEMBLES 
ñn 
g ensemble vide E x somme des n éléments X1, X2, … Xn 
{a, b} ensemble ayant pour éléments a et b i=1 
Card E cardinal de l'ensemble E à 
E appartient à (ou : est élément de) II x produit des n éléments X1, X2, …, Xn 
C= n'appartient pas à i=1 
= est inclus dans df : ee 
& n'est pas inclus dans ax QU F (x) dérivée de f 
U réunion 
(e intersection Pr : 
U Ei réunion d'un ensemble d'ensembles A CHArPRAÉNEERE 
tel (réunion de la famille E; pour i = i-ième dérivée partielle de f 
appartenant à |) OXi ae . 
NE; intersection d’un ensemble d’en- dfx, OU dxof différentielle de f au point x, 
iel sembles ÎF(x) dx intégrale de f. || intégrale double. 
E x Ë produït cartésien de deux ensembles [x| valeur absolue de x ou module de x 
EetF (E croix F) 
(x y) couple Ix|| norme de x 
(X; Vs z) triplet n! factorielle n 
(X1, X2, … Xn) n-uplet œ; B,.X: 0 scalaires 
IT E; produit cartésien de la famille E; Q ensemble d'opérateurs 
tel pour i appartenant à | gread. f gradient de la fonction f 
En produit cartésien de n ensembles div. V divergence du champ de vecteurs V 
égaux à E rot. V rotationnel du champ de vecteurs V 
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INDEX DES NOMS CITÉS 


Les références sont données par l'indication du numéro de la page où se trouve le terme, suivi, le cas échéant, des lettres a ou b se rapportant respec- 
tivement à la colonne de gauche ou à la colonne de droite de chaque page. 


Les références sont données, pour les illustrations, par le numéro de la page en caractères gras et, pour le texte, par le numéro de la page en caractères 
maigres pour une simple citation, et en italique pour un développement plus complet. 


Pour les différentes Variantes se rattachant à un même terme, un astérisque indiquera le renvoi à ce dernier. Ex. : 


A 


addition 36 b 
adjoint d'un endomorphisme 74 b, 74 
adjonction symbolique 79 b 
adressage indirect 247 a, 247 
adresse 244 a 
affixe 45 
algèbre de Boole (clan) 126 a 
— homologique 76 b 
— linéaire 67-76 
ALGOL 252 a 
algorithme 216 a, 216 
— d'Euclide 39 b 
— de Gauss 219 a 
A-module 76 a 
— næthérien 76 b 
amortissement 256, 256 b, 257 
analyse 777-150 
— canonique 272-213 
— classique 717-148 
— de données 207-215 
— discriminante 270-271 
— factorielle 207-277 
— fonctionnelle 757-761 
— harmonique 748-150, 189-190 
angle 82 
— solide 85, 87 
— sphérique 98 b 
anneau 53-54 
— commutatif 38 b 
— intègre (ou d'intégrité) 39 a, 54 a 
— quotient 54 b 
— unitaire 53 b 
annuité 255, 256 a, 255 
antilogie 233 a 
appartenance 20 b 
application 28, 32 
— bijective 28 b, 32 
— contractante 114 b 
— identique 28 b 
— linéaire 64 
— lipschitzienne 114 b 
— réciproque 28 b 
approximation 225 a, 225 
Arc cosinus 95 b, 95, 120 
— sinus 95 b, 95, 120 
— tangente 95 b, 95, 120 
arithmétique binaire 247-243 
— égyptienne 282, 282 
arrangement 56 
associativité 49 a 
automorphisme 53 a 
axe factoriel 208 a 
axiomatique 5-6 
axiome d'Archimède (ou d'Eudoxe) 
82 b, 290 b 
d'Euclide 82 a 
d'extensionalité 29 
de la paire 30 a 
— la réunion 30 a 
Pasch 82 a, 82 
réductibilité 16 a 
— sélection 29 b, 30 a 
— des parallèles 82 a 
— parties 30 b 
du choix 33 a 


compteur ordinal 
* 


C.O 


C.O. (compteur ordinal) 246 a 


B 
base 62-68 
— hilbertienne 160 a 
bidual 68 a 


binôme de Newton 56 b 
birapport 88 b 
bit 237 a 


. boostrap 251 a 


borne supérieure 32 
Bourse 253 
bouteille de Klein 114, 169 


C 


calcul infinitésimal 297-299 
— matriciel 64-76 
— numérique 277-227 
— propositionnel 231 b 
— tensoriel 762-167 
calculateur électronique 244, 247 
— scientifique 225 
caractéristique d'Euler-Poincaré 169, 
0a 
cardinal d'un ensemble 25 b, 33-34 
carte 170 b, 170 
— perforée 5 
cash-flow 257 a 
catégorie 50 b 
cercle 104 a, 105 
— de convergence 133 a 
— trigonométrique 92 a, 92 
chaîne de Markov 786-187 
— ergodique 186 b 
changement de base 67 b-68 a 
chemin critique 59-60 
circuit logique 240 
— séquentiel 241 a 
clan 
* algèbre de Boole 
classe d'équivalence 25 b, 32 
classifications automatiques 273-275 
C.O. (compteur ordinal) 246 a 
COBOL 252 a 
code de Hamming 238 a, 238 
— redondant 237 b 
coefficient angulaire (pente) 103 b 
— de corrélation de Pearson 184 a, 
185 a 
— — Fourier 148 b 
cœur 263 b 
col 203, 203 
colinéation 90 a 
combinaison 56 
combinatoire 56 
commutativité 49 
complémentaire 22 b, 22, 30 b 
composition de deux applications 28 b 
compteur ordinal 


conditions de Cauchy-Riemann 145 b 
cône 108 b, 108 

conique 704-107, 105 

conjecture des quatre couleurs 61 a 
connecteur 231 b 


constante d'Euler 45 a, 144 b, 300 b 

— d'Euler-Mascheroni 130 b 

continuité 713-115, 119 

convention d'Einstein 163 

convergence simple 151 b 

— uniforme 151 b 

coordonnées bipolaires 103 a 

— cartésiennes 101, 101 

— cylindriques (ou 
107 b, 107 

— elliptiques 103 a 

— polaires 101, 101 

— sphériques 107, 107 b 

corps 55 a 

— archimédien 43 

corrélation 783-784 

cosinus 92 b, 93 

— directeur 103 b 

— hyperbolique 97 a 

cotangente 92 b, 93 

coupe de capacité 59 a 

couple 23 b 

courbe 768-174 

— coordonnée 101 b 

— de Peano 168 b 

— — régression 183 b 

— intégrale 134 

covariance 163 a 

crible d'Ératosthène 40 

critère de Cauchy 131 b 

— — convergence 131 

— — d'Alembert 131 b 

cube 85 

cylindre 108 b, 108 


semi-polaires) 


D 


DCB 
* système décimal codé binaire 
décomposition canonique 40, 41 a 
définition en compréhension 21 
— — extension 21 
degré 92 a 
— de confiance 198 a, 198 
dénombrement 33-35 
dérivée 120 b, 121 
— discrète 225 b 
— partielle 123 b 
déterminant 70-717, 70 
développement en série 123 
diagonale de FE? 24 a 
diagramme sagittal 24 b, 24 
didactique mathématique 276 b 
dièdre 86 
différence symétrique 23 a, 30 b 
différentielle 123 b, 299 a, 299 
directrice 104 b, 105 
distance 82 b, 98 a, 98, 213 b 
— triviale 
* métrique discrète 
— ultramétrique 213 b 
distribution 160 b 
— binominale 180 b 
— de Dirac 161 a, 179 b 
— — Gauss (ou normale) 177 b, 178, 
181-182 


— — Poisson 181 a 

— — 72 197, 198 

— G 179,179 

— hypergéométrique 177 a 
divisibilité 39-47 

division 39 

— par effaçage 39 

domaine de définition 28 a, 118 b 
droite 81, 82, 86, 103, 103, 108 a 
dual 64 b 

— topologique 157 a 

dualité 68 

— de Poncelet 88 b 

duplication du carré 289 b 


E 


écart type 179 a 

élément 20 b 
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Briolle - Rapho 


LES MATHÉMATIQUES 


Au cours de ces cinquante dernières années, la part consacrée aux mathématiques dans les 
enseignements des lycées et des collèges n'a cessé d'augmenter. Impossible donc aujourd'hui d'es- 
pérer revêtir la robe de l'avocat, la blouse du chirurgien ou le tablier du charcutier sans avoir, des 
années durant, endossé la toge prétexte du mathématicien. Qu'il semble lointain le temps des huma- 
nités grecques et latines qui permettait à tel fils d‘instituteur de province, lauréat du concours général 
de thème grec et grand amateur de poésie, d'accéder aux plus hautes fonctions politiques ! 

Cette évolution est due, à l'évidence, au développement des sciences et des techniques et à 
leur influence déterminante sur la croissance économique de nos pays. L’omniprésente informatique, 
par exemple, est grande consommatrice de mathématiques, et les progrès considérables réalisés en 
ce domaine rendent nécessaire la formation d'un grand nombre de personnes possédant un bon 
niveau en mathématiques. 

Il faut cependant noter que cette évolution a également coincidé (ce n'est, bien sûr, pas un 
hasard) avec un développement sans précédent de la science mathématique e//e-même. Les pro- 
grammes de l’enseignement ont été largement modifiés, non sans susciter des réactions parfois vives 
à l'encontre de ces mathématiques dites modernes. Il est bon de préciser cependant que ces mathé- 
matiques ne sont pas aussi modernes qu'on veut bien le dire ! En tant que telles, elles ont plus d'un 
siècle (ce qui est un âge fort raisonnable), puisqu'elles sont le point d'aboutissement d'un mouvement 
qui débute avec les travaux de Galois, de Cauchy et de Cantor, et date du siècle dernier. De plus, 
loin de sacrifier aux attraits de la modernité, ce mouvement est inspiré par les principes du classicisme 
le plus pur, car il est essentiellement l'expression d'un retour aux sources auxquelles la science mathé- 
matique va puiser à la fois son autonomie par rapport aux autres sciences et son unité. Autant dire 
que le qualificatif « moderne » est usurpé à plus d'un titre (comme toujours d'ailleurs). 


La méthode 


Où donc les mathématiques ont-elles trouvé leur unité, sinon au cœur même de la démarche 
intellectuelle que l’on retrouve aussi bien en analyse, en algèbre, en arithmétique qu'en géométrie ? 
Cette démarche est connue sous le nom de « méthode axiomatique ». 

La méthode axiomatique est généralement définie de la manière suivante : « De certaines 
propositions, appelées axiomes et supposées vraies, on déduit d'autres propositions par un enchaîne- 
ment rigoureux, c'est-à-dire gouverné selon les règles de la logique formelle, elle-même soigneuse- 
ment formalisée et axiomatisée. » Ainsi donc, si l’on admet cette définition, la méthode axiomatique 
serait purement déductive. |] s'agit là d'une restriction très couramment admise, qui peut conduire à 
de graves erreurs pédagogiques. À cet égard, Nicolas Bourbaki, mathématicien polycéphale, dit fort 
bien : « Ce que se propose pour but essentiel l'axiomatique, c'est précisément ce que le formalisme 
logique, à lui seul, est incapable de fournir, l'intelligibilité profonde des mathématiques T..]. La 
méthode axiomatique trouve son point d'appui dans la conviction que, si les mathématiques ne sont 
pas un enchaînement de syllogismes se déroulant au hasard, elles ne sont pas davantage une collec- 
tion d'artifices plus ou moins astucieux faits de rapprochements fortuits où triomphe la pure habileté 
technique. » 


À La carte perforée, élément 
indispensable, de nos jours, 
de l'utilisation 

du calculateur électronique, 
a été inventée, sous 

une forme moins élaborée, 
il y a 250 ans; on s'en servit 
pour la première fois 

sur des métiers à tisser. 


Y 11 n'est pas possible 
de lire des mathématiques 
comme on lit un roman... 


En réalité, la méthode axiomatique se décompose en deux phases distinctes, bien qu'étroi- 
tement complémentaires : une phase inductive et une phase déductive. 

Au cours de la phase inductive, /e mathématicien donne libre cours à son imagination et à 
son intuition afin de déterminer l'énoncé qu'il désire établir. Pour cele, il se fiera à son propre juge- 
ment ainsi qu'à son expérience, c'est-à-dire à ce qu'il connaît du développement historique de son 
champ d'étude. Souvent, il s'agira de généraliser un résultat déjà connu en escomptant une certaine 
régularité des concepts étudiés. Allant du particulier au général, le mathématicien tente de résoudre 
ainsi la question : Que démontrer ? Suivra alors la phase déductive, au cours de laquelle il enchaïînera 
les propositions d'une manière rigoureuse à partir des prémisses soigneusement formulées : « Le 
terrain que l'intuition a conquis ainsi d’un seul bond! il reste ensuite à l’organiser, à bâtir maillon par 
maillon la chaîne de propositions qui aboutira au résultat cherché. » (J. Dieudonné) Allant mainte- 
nant du général au particulier, le mathématicien tente de répondre à la question : Comment démontrer ? 
En réalité, ces deux phases sont étroitement liées. Elles se succèdent à la faveur d’un mouvement 
dialectique au cours duquel les concepts mathématiques sont définis et s'enrichissent dans un 
processus de synthèse permanent. 

Au bout du compte, seul subsiste le résultat de la phase déductive, c'est-à-dire une écriture 
de propositions agencées de manière cohérente. Mais ce résultat doit sa portée mathématique au 
fait qu'il a émergé d'un processus intellectuel évoluant de manière dialectique. Ainsi, contrairement 
à l’image qu'elle donne d'elle-même, la démarche mathématique ne se déroule pas de manière 
aveugle et mécanique dans un univers sans âme. À en croire le sens commun, le mathématicien serait 
semblable à une sorte d'explorateur des forêts tropicales qui se fraye un chemin rectiligne à travers 
une nature putride et inhospitalière, regardant droit devant lui sans jamais se retourner, sans risquer 
un coup d'œil sur ce qui l'entoure. Une telle image est bien imparfaite et ne rend guère compte de 
l'originalité de l'activité du mathématicien. La comparaison serait plus acceptable dans un univers 
surréaliste. L’explorateur est en communion intense avec Ja forêt qu'il pénètre; chacun de ses pas 
modifie le relief du sol, la forme des arbres et la couleur de leurs feuilles. À chaque instant, il constate 
que le chemin parcouru s'est profondément transformé ; il ne vient pas d'où il est parti. Subitement 
pourvu du don d'ubiquité, voici qu'il réalise qu'il progresse dans plusieurs directions à la fois, bernant 
ainsi la rose des vents métamorphosée en girouette. 

Restreindre la démarche mathématique à sa phase inductive, c'est, sous couleur de sponta- 
néisme soi-disant génial, faire preuve de laxisme et de facilité en se contentant de vagues heuristiques ; 
de même, la restreindre à sa phase déductive, c'est la condamner à la stérilité et à l’ésotérisme dans 
une contemplation aveugle de truismes plus ou moins tautologiques. 


Des ensembles 


Appliquant ainsi au fil des siècles la méthode 
axiomatique — même sans trop se le dire — 
les mathématiciens ont progressivement conduit 
leur science à un point d'évolution où ils ont 
vivement ressenti la nécessité de dégager ce qui 
constituait la trame des diverses branches des 
mathématiques qu'ils distinguaient jusque-là. 

La théorie des ensembles est ainsi apparue 
au cours du X/X® siècle. Sorte de théorie du 
langage mathématique, elle fournit une repré- 
sentation claire et maniable des règles de logique 
élémentaire. Les notions d'ensemble, de sous- 
ensemble, d'application sont définies de manière 
formelle, ainsi que les règles opérationnelles que 
l’on connaît (réunion, intersection.) qui sont 
alors parfaitement explicitées. Ainsi la théorie des 
ensembles n'est pas sortie toute casquée du 
cerveau d'un mathématicien génial (bien que 
Cantor le fût). Elle est la conséquence quasi 
inéluctable d'un développement de la science 
mathématique selon la méthode axiomatique; 
elle est autant le fruit de la nécessité que du 
hasard. 

L'ensemble R des nombres réels est, de par sa 
construction même, un des ensembles les plus 
riches (sinon le plus riche) des mathématiques. 
En effet, de multiples concepts y sont définis 
avec de nombreuses propriétés les reliant. En 
appliquant la méthode axiomatique, on dégagera 
trois structures fondamentales ; c'est-à-dire que 
l’on regroupera les concepts et leurs propriétés 
en très grands agrégats. Cette classification 
n'est pas arbitraire ; elle est le fruit de l'expérience 
acguise au cours du développement antérieur 
de la science mathématique. Le mathématicien 
entrevoit son intérêt scientifique en subodorant 
les généralisations auxquelles elle pourra 
conduire. 


-Ph. Charbonnier - Réalités 


On distingue ainsi trois grands types de 
concepts définis sur R et de nature mathémati- 
que différente : 
des opérations (addition et multiplication) 
à l’aide desquelles il est possible de combiner 
certains nombres pour en obtenir d'autres ; 

— une relation notée < qui permet de compa- 
rer deux nombres quelconques ; 

— une opération « valeur absolue » grâce à 
laquelle il est possible d'évaluer la proximité 
de deux nombres. 

En opérant cette distinction, il est clair que 
l’on appauvrit sensiblement l'ensemble R 
ces trois types de concepts ne sont pas indé- 
pendants, car ils sont définis de manière cons- 
tructive à partir d'un corps de concepts plus 
limité. Par exemple, la définition de la valeur 
absolue découle de celle de la relation < puisque 


x > 0 
X < 0. 


[+ x si 


IX| = x 57 


Mais le mathématicien peut à loisir ignorer 
ces relations de dépendance et de compatibilité 
pour considérer chaque type de concepts de 
manière isolée et le soumettre à l'épreuve de 
Ja méthode axiomatique. Prenons l'addition, par 
exemple; elle vérifie les propriétés évidentes : 


(G1) x+(v+2) = (x+7Y) +2z 

(G2) xX+y=Yy+x 

(G3) il existe un nombre, 0, tel que 
O+x=x+0—=Xx 

(G4) x + (— x) = 0. 


Le mathématicien va induire de ces quatre 
propriétés une structure générale : la structure 
de groupe. // lui reste alors à déduire de manière 
rigoureuse toutes les propositions qui découlent 
de la définition par les propriétés GT, G2, G3, G4 
pour voir se bâtir une nouvelle théorie, parfaite- 
ment indépendante de l'idée initiale qui avait 
consisté à isoler quelques concepts particuliers 
de R pour les généraliser. Cela étant fait, il 
pourra remarquer — à sa grande satisfaction — 
qu'il retrouve cette structure de groupe dans 
d'autres branches des mathématiques (groupes 
de transformations géométriques, par exemple) 
qui bénéficient du même coup de tous les résul- 
tats de la théorie élaborée. Il va sans dire que 
cela constitue une version très simpliste de la 
genèse de la théorie des groupes. Il a fallu 
beaucoup de temps et de mathématiciens pour 
qu'elle accède au rang de théorie! 


Structures en mathématiques 


Il est malaisé de donner une vue d'ensemble 
de Ja science mathématique. On peut néanmoins 
affirmer sans crainte qu'elle ne se présente 
guère sous la forme stratifiée et officielle des 
programmes scolaires et universitaires, et qu'elle 
est aujourd'hui plus que jamais en pleine évolu- 
tion, toujours en quête de sa propre unité. 

Ainsi que nous venons de le voir à propos des 
nombres réels, trois grands types de structures 
doivent être distingués. 

— Des structures  algébriques (groupe, 
anneau, corps, espace vectoriel.) qui traitent 
d'ensembles munis de lois de composition, 
grâce auxquelles on combine certains éléments 
pour en obtenir d'autres. 

— Des structures topologiques qui fournissent 
une formalisation abstraite des notions intui- 
tives de voisinage, de limite, de continuité, etc. 


L 


Le 


— 


ÿ: 


— Des structures d'ordre qui expriment la 
possibilité de comparer des éléments. 


Structure algébrique —— COMBINER 
Structure topologique —— APPROCHER 
Structure d'ordre —— COMPARER 


Ces trois structures mères constituent la char- 
pente de l'édifice mathématique tel qu'il se 
présente aujourd'hui. Au-delà de ce premier 
noyau apparaissent ce que l'on pourrait appeler 
les structures multiples, qui se situent à la 
confluence de deux ou plusieurs structures 
mères. Ainsi, l'algèbre topologique est l'étude 
des opérations algébriques compatibles avec 
une structure topologique donnée, celles qui 
sont continues pour la topologie que l’on consi- 
dère. L'analyse fonctionnelle est précisément 
de ce type-là, puisqu'elle développe l'étude des 
espaces vectoriels topologiques. De même, le 
topologie algébrique est l'étude des opérations 
s'effectuant sur certains ensembles de points 
définis par des propriétés topologiques (sim- 
plexe, cycle..).Son développement récent corres- 
pond à une tendance de la science mathématique 
à l'algébrisation de toutes ses branches, qui, 
issues de l’analyse, sont fondées sur des argu- 
ments et des procédés de raisonnement cons- 
tructifs et non point déductifs. 


À L'omniprésente 
informatique est grande 
consommatrice de 
mathématiques. 
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de ceux qui ne comprennent 
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de leurs aînés), 
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Mathématique et arbitraire 


Nous avons montré que la démarche mathé- 
matique procède d'un balancement continuel 
induction = déduction. C'est l'assimilation abu- 
sive à la seule déduction qui, pour beaucoup, 
semble donner à la science mathématique un 
aspect « autoritaire » de science qui ne peut que 
dire la vérité. En réalité, il s'agit là d'un artifice 
qui consiste à oublier le problème de l'adéqua- 
tion des axiomes de base à ce que l'on cherche à 
étudier : en écartant volontairement les cas qui 
ne vérifient pas les hypothèses qu'ils prennent 
pour base de leurs modèles, les économistes 
ou les physiciens font un choix sur lequel Ja 
discussion est souvent acharnée; de même, en 
délimitant le cadre de l'étude par un système 
d'axiomes, les mathématiciens prennent une 
position qu'il importe de montrer sans ambiguité 
dans son caractère non absolu. 

Beaucoup d'exemples pourraient être donnés 
à ce propos, et le plus frappant est peut-être 
celui qui est fourni par la statistique, elle-même 
fondée sur le calcul des probabilités. Les magni- 
figues idées de Pascal nécessitèrent bien vite 
une formalisation claire de cet outil : il fallait 
définir la probabilité pour lui appliquer alors 
en toute rigueur les règles de la logique. Beau- 
coup (de Laplace à Poincaré et Hadamard...) 
se heurtèrent à la notion de hasard, et il semble 
bien que, depuis des siècles, ce mystérieux hasard 
soit ce qui sépare mathématiciens et philosophes 
réunis pour en discuter. Alors, malheureusement, 
on à parfois recours au formalisme le plus ardu 
pour définir un outil — la probabilité — que 
l'on ne cherche à justifier (si l’on suit l’ordonnan- 
cement scolaire ou universitaire) qu'après de 
longs et difficiles développements par la loi des 
grands nombres, loi qui, présentée au contraire 
dans son contexte concret, fait apparaître l'ambi- 
guïité première du calcul des probabilités : elle 
oblige en effet à se poser de multiples questions, 
en particulier sur la répétition d’une expérience 
dans des conditions bien définies, et bien 
d'autres encore. 

On ne peut donc pas assigner à la science 
mathématique cet aspect mystique, mais telle- 
ment stérile, de science « éthérée », dégagée de 
tout sectarisme, de tout subjectivisme, et qui ne 
se discute pas. Ce n'est pas le développement 
technique en lui-même d'une question (le 
calcul des probabilités, par exemple) qui peut 
être suspecté, mais le fondement de son déve- 
loppement. 


De la pédagogie 


L'autre aspect usuellement mis en évidence 
dans la caractérisation de la science mathéma- 
tique est la nécessité de sa démarche logique et 
formelle, autrement dit de son procédé déductif. 
Le XIXe siècle a été celui d’une certaine révolu- 
tion pour la pratique mathématique; la rigueur 
de la déduction à été installée par l’axiomatique. 
C'est en ce sens qu'il faut considérer les mathé- 
matiques comme abstraites. Cependant, il ne 
faut pas assimiler rapidement le terme abstrait 
et le terme moderne, comme y invitent un grand 
nombre de clichés de notre vie de tous les jours. 
Tout d'abord, on ne devrait pas oublier que les 
« mathématiques modernes » ne sont en aucune 
facon une rupture avec les autres mathématiques 
(et l’on entend souvent par là, celles que l’on 
peut se représenter), et que l’on n'a fait que suivre 
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l'évolution générale de la pensée humaine. 
Ensuite, que ce formalisme a déjà plus d'un 
siècle et ne répond donc sûrement plus à cette 
épithète, qui se trouve le plus souvent utilisée 
comme un épouvantail. 

Il y a certainement un fond bien justifié à cette 
idée, car le souci de rigueur dans la méthode 
semble avoir conduit à de notables exagérations. 
Cela est d'autant plus clair après que l'on a bien 
mis en évidence la nécessité de la phase induc- 
tive dans Ja pratique mathématique. Nous repren- 
drons bien volontiers les termes de M.-D. Revuz, 
par lesquels il nous paraît cerner les problèmes 
de base que l'enseignement actuel des mathé- 
matiques n'a pas résolus : « Reprocher aux 
mathématiques d'être abstraites est une sottise : 
elles le sont par nature; mais reprocher à un 
enseignement des mathématiques de ne pas 
montrer nettement d'où et comment les mathé- 
matiques ont été abstraites est légitime. » On 
pourrait résumer ces termes en disant que l'abs- 
traction ne peut être prise pour une fin en soi, 
et que chaque concept mathématique abstrait 
est l'aboutissement d'une longue suite de déve- 
loppements sur des thèmes au départ plus 
familiers à notre compréhension. Autrement 
dit, il n'est possible de saisir avec fruit ces 
notions, fort peu « parlantes » en général, qu'à 
l’aide de leur histoire. Il y a une unité profonde 
de la science mathématique dans le temps et 
dans l’espace, et l’on devine l'angoisse de ceux 
qui ne comprennent pas, à dix ou douze ans 
(sans parler aussi de leurs aînés), qu'une droite 
puisse être « le supplémentaire d'un hyperplan », 
à moins qu'elle ne soit définie comme « un 
ensemble de points muni d'une bijection g 


avec l’ensemble R telle que toute autre bijec- 
tion f de D sur R s'en déduise par translation : 
(M) = g(M) +a»l! 

C'est cette unité qui lui donne sa dynamique 
propre et lui permet de progresser, contrairement 
à une idée trop répandue — même par certain 
dictionnaire — selon laquelle la mathématique 
est figée, immuable, et n'a plus de secrets. 
Les mathématiques ont aussi des bases concrètes 
(et souvent, elles ont là la source de leurs plus 
grandes difficultés, ainsi l'idée de probabilité 
évoquée plus haut) et une histoire dont l'igno- 
rance met une barrière à tout essai de com- 
préhension ; harmonieusement liées, elles guident 
vers un exposé plus formel dégagé de toute 
ambiguité et de tout ésotérisme. 


Mathématique et histoire 


Il n'y a pas plus de mathématiques modernes 
sans aucun lien avec l'édifice mathématique 
construit au fil des siècles qu'il n'y à de nouvelle 
physique relativiste contredisant la mécanique 
classique de Newton; chacune est un modèle 
et correspond à une certaine échelle, les plus 
récentes tentant de représenter concurremment 
deux types de phénomènes tout en les unifiant. 
Ainsi, l'étude des figures géométriques que sont 
le cercle, l'ellipse, la parabole et l'hyperbole est- 
elle devenue l'étude « réunifiée » des sections 
planes du cône de révolution, le développement 
de l'algèbre linéaire et multilinéaire posant ensuite 
un cadre général aux courbes et surfaces du 
second degré, coniques et quadriques. On peut 
citer encore le cas de la droite, dont on a parlé 
plus haut, envisagée d'abord comme le plus 
court chemin d'un point à un autre (et donc 
définie par ces deux points), puis comme sous- 
espace vectoriel, enfin comme structure iso- 
morphe à l'ensemble R. La notion de mesure 
fournit encore un exemple de réunification 
pour les notions de longueur, de surface, de 
volume, et même aussi de probabilité; il est 
essentiel de ne montrer un développement théo- 
rique de l'intégration qu'au travers de ces idées, 
faute de quoi on ne joue qu'un jeu d'abstrac- 
tion outrancière. On ne peut d'ailleurs com- 
prendre où va et où peut aller l'esprit dans sa 
recherche de rigueur pour la construction mathé- 
matique qu'en évoquant les étapes antérieures 
et les nécessités qui ont poussé à leur formulation. 
C'est alors, et alors seulement qu'apparaitront 
l'utilité du travail du mathématicien et sa place 
dans la démarche générale de la pensée humaine. 

Il n’est pas possible de lire des mathématiques 
comme on lit un roman, sauf lorsqu'on ne cherche 
à tirer de sa lecture qu'un vague souvenir de 
titres et de sous-titres. Le but de la science 
mathématique ne peut être atteint que par des 
moyens (dont le moins important n'est pas le 
langage) dont la maîtrise ne peut s'acquérir 
qu'au terme d'une certaine pratique. 

Nous avons donc pris le parti dans ce volume 
de ne pas rechercher un exposé didactique. La 
littérature mathématique est abondante et peut 
suffire à toute demande de ce type. Nous avons 
surtout cherché à donner ici un apercu démysti- 
ficateur sur la science mathématique. Nous 
avons donc pensé que le chapitre Histoire des 
mathématiques devait être la pierre centrale 
de ce volume, et non pas une introduction à de 
multiples développements techniques. 1] nous 
a donc semblé intéressant de placer cet apercu 
historique en fin de volume, après les différentes 


matières traitées. Une première lecture des pre- 
miers chapitres pourra ainsi permettre de saisir 
plus complètement l'évolution des mathémati- 
ques. 

Il n’a pas été non plus dans notre intention de 
faire un exposé complet de chaque matière. 
Nous avons plutôt tenté de donner un apercu 
simple des problèmes, tout en dépassant le 
stade de quelques considérations de salon. La 
bibliographie indiquée au terme de chaque 
chapitre donne, par contre, l’occasion à celui 
qui le désirerait de poursuivre ses idées sur la 
matière. 


B. GOLDFARB 
et J. THÉPOT 


À La notion de mesure 
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Snark International 


MATHÉMATIQUES 
ET PHILOSOPHIE 


Au moment où la philosophie semble décriée, la philo- 
sophie mathématique n'est pas seulement vivante, mais 
douée de moyens techniques qui en assurent l'éternité. 
J. Hadamard remarquait justement, dans une préface 
(1926) aux Fondements des mathématiques de F. Gon- 
seth, que c'est « un bien étrange phénomène, sans pré- 
cédent dans l'histoire de la pensée », qu’ « une science 
parvenue à l'état positif [soit] en train de faire marche 
arrière et de revenir à l'état métaphysique », ce qui est 
précisément le cas de la mathématique, réputée si simple, 
si ancienne, et si parfaite. Et de fait, il y a en mathéma- 
tiques, depuis la fin du XIX® siècle, comme un retour 
à la philosophie, à une pensée profonde qui sonde 
l'être mathématique pour en formuler, enfin, la nature 
sans quitter le terrain de la rigueur, sans déroger aux 
principes qui ont établi la réputation de cette discipline 
depuis que la philosophie grecque l’a promue au rang de 
modèle de toute rigueur, de type idéal de tout discours, 
et en particulier du discours philosophique. 

Les liens se sont tissés entre la mathématique et la 
philosophie depuis qu'il existe une mathématique rigou- 
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reuse, c'est-à-dire, hypothético-déductive. Ce n'est pas 
un hasard si l'idée d'universalité qui semblait caractériser 
les énoncés mathématiques de manière essentielle a 
présidé à la naissance des grands discours philosophiques. 
Maints philosophes auraient bien voulu qu'on pût dire 
aujourd'hui de certaines propositions philosophiques 
ce qu'on dit de la démonstration mathématique : que ce 
qui était une démonstration pour Euclide le demeure 
toujours pour nous. Malheureusement, le discours philo- 
sophique n’a jamais pu produire le système dont il rêvait. 
C'est pourquoi nous allons essayer d'abord de voir quelle 
fut l'intention première de ce discours, aujourd'hui périmé. 
Cela nous permettra ensuite de mieux mesurer la signi- 
fication de la renaissance effective d'une certaine philo- 
sophie mathématique à partir du XIX® siècle. Mais aupa- 
ravant, à quoi se réduit le projet philosophique tradi- 
tionnel, contemporain de l'émancipation des mathé- 
matiques à l'égard des magies et des techniques, et 
devenu aujourd'hui sans importance, dans sa forme 
primitive, pour les mathématiques ensemblistes, axio- 
matisées, « appuyées » sur la logique mathématique 
contemporaine ? 


Les rapports des mathématiques 
avec la philosophie 


Le privilège de la « réflexion »; 
le projet du rationalisme traditionnel 


En fait, il semble que la révélation du discours démons- 
tratif ait été, d'emblée et en même temps, la principale 
source de la philosophie comme discours rigoureux. 
Toutefois, le discours philosophique, qui aspirait à la 
rigueur, en transformant celle-ci en thème explicite 
propre tombant dans le champ de ses compétences, 
visait plus haut. Il voulait fonder d'abord cette rigueur 
mathématique qui avait le défaut d'être limitée aux mathé- 
matiques et, en tant que telle, était incapable de se fonder 
elle-même. C'est pourquoi l’on voit Platon, déjà, s’efforcer 
de développer une critique des mathématiques comme 
domaine scientifique spécifique, trop étroit pour le 
projet de critique et de fondation radicale qui anime 
la philosophie en tant que telle. Il fallait retrouver dans 
un discours plus primitif, dans une racine plus profonde, 
les raisons ultimes qui permettent de caractériser la 
rigueur mathématique par les propriétés qui lui reviennent 
en propre et en droit, et qui en font une activité intellec- 
tuelle indépendante de l'univers matériel et contraignante 
pour tout sujet. Or, ce discours, c'est la dialectique. 

Le postulat général de toute la philosophie occidentale 
est par là suffisamment indiqué. Il ne dit rien d'autre que 
ceci : la possibilité, bien que chaque fois soumise à rude 
épreuve, d'un discours fondamental où d'une démarche 
fondatrice qui livre la vérité ultime des techniques démons- 
tratives. La théorie de la réminiscence est la première 
tentative pour expliquer le fait de l'indépendance de ces 
techniques envers toutes les contingences de nature 
subjective ou expérimentale, de leur apparence omni- 
temporelle, interprétée dans le sens d'objets idéaux, éter- 
nels, non soumis aux vicissitudes du temps, dans le sens 
d'une mathésis universelle et essentielle, comme l'on 
dira beaucoup plus tard. Or, toutes les grandes philo- 
sophies ultérieures, tous les rationalismes sont autant 
d'essais d'explication conçus pour les mêmes faits. 

Ainsi, l'évidence cartésienne, par exemple. Elle est 
d'abord celle du cogito, du « je pense », manifestée au 
terme d'un doute méthodiquement mené comme seul 
foyer de résistance à ce doute, comme seul élément 
qui ne se laisserait réduire qu’au prix d’une réduction à 
l'absurde de l'ensemble de l'entreprise. La vérité mathé- 
matique elle-même ne résiste pas au doute : Descartes 
imagine un Malin Génie qui rendrait l'homme capable 
de douter de la vérité de 2 + 2 — 4. Toutefois, je ne 
peux douter, dit-il, que /e doute; et que je puisse être 
trompé prouve encore que je pense, et donc que j'existe 
en tant que tel. 

Si bien que, du point de vue du sujet connaissant, tout 
repose sur cette évidence, qui est un /ntuitus (intuition — 
vision) modèle, car le cogito, dont la connaissance n'est 
que l'établissement d'un point ferme dans le doute uni- 
versel et radical, met fin à l’universalité du doute en 
instaurant une vérité sur laquelle s'articulera toute la 
chaîne des certitudes. Fournissant un échantillon de 


l'évidence propre à une vérité indubitable, le cogito, 
dit un commentateur, permet de considérer comme telle 
tout ce qui possède une vérité comparable. Les énoncés 
mathématiques eux-mêmes ne constituent que des 
vérités relatives au cogito, parce que la vérité du cogito 
est encore plus simple que celle des vérités mathématiques. 
Celles-ci peuvent fonder les représentations sensibles ; 
celui-là fonde toute représentation possible. Il est condi- 
tion nécessaire de tout ce que nous pensons; car « il est 
impossible que nous puissions jamais penser à aucune 
chose que nous n'ayons en même temps l'idée de notre 
âme », que le cogito n'accompagne notre pensée. 

Est-ce autre chose qu'entreprend Kant? Certes, si l'on 
considère la différence d'horizon, due essentiellement 
à l'importance, aux yeux de Kant, de la physique newto- 
nienne : en second lieu, à une différence de langage, due 
elle aussi à la constitution, au temps de Kant, d'une science 
rationnelle de la nature; en troisième lieu enfin, au fait 
que sa conception ne jaillit pas d'innovations techniques, 
mais d'une interprétation des propositions élémentaires 
de la mathématique traditionnelle. Soit la géométrie 
euclidienne, par exemple. On ne peut dire qu'elle se fonde 
sur l'expérience. Ce serait attenter à son universalité. 
Or, elle se fonde sur l'idée d'espace. Celle-ci ne pouvant 
être un donné empirique, elle ne peut être un pur concept. 
Si la notion de concept est distincte ici de celle de concept 
abstrait, c'est-à-dire extrait de l'expérience, elle ne repose 
pas non plus sur un concept pur, c'est-à-dire qu'en dernier 
ressort, elle est irréductible à la pure logique. N'étant 
ni purement logique, ni expérimentale, on lui crée une 
forme nouvelle d'état civil : le concept d'éntuition pure, 
par lequel Kant limite le pouvoir de l'entendement, disons, 
de logique pure, à la forme de la sensibilité. Cette forme, 
celle de l’espace en l'occurrence, est irréductible à un 
concept, comme l'illustre l'exemple de l'égalité indirecte 
des figures, qui, ainsi que les mains, ne sont superposables 
que par retournement dans l'espace, c'est-à-dire que la 
symétrie ne conserve certaines propriétés de la figure 
qu'en inversant celle-ci, phénomène dont l'analyse logique 
ne peut nullement rendre compte, ce qui est vrai tant que 
l'on ne dispose pas du groupe des transformations qui 
conservent les angles en grandeur tout en changeant leur 
signe. Il en résulte pourtant que les jugements mathé- 
matiques sont synthétiques (irréductibles à la logique) 
et purs (non d'origine expérimentale). Or, non seulement 
c'est le philosophe critique qui met au jour cette vérité 
de nature d'ailleurs philosophique, mais de plus l'idée 
de synthèse rationnelle est au principe de toute science. 
Et nulle science n'échappe à la fondation de mode désor- 
mais critique. 

Après Kant, Husserl retrouve une inspiration plus carté- 
sienne, mais inscrite dans le projet général et rationaliste 
tout à fait dans la lignée de Platon, de Descartes et de 
Kant. Husserl entreprend, dès les Recherches logiques, 
de montrer que la mathématique et la logique constituent 
un domaine qui ne peut se confondre avec les conditions 
subjectives qui permettent d'en prendre connaissance. 
Par là, Husserl suit l'enseignement de son grand contem- 
porain, G. Frege, pour lequel les mathématiques (en 
vérité l'arithmétique), étant un prolongement de la 
logique, ne peuvent être élucidées par l'étude de leur 
genèse psychologique. Mais Husserl ne suit pas Frege 
jusqu'au bout; il réeffectue la philosophie cartésienne 
dans la mesure où il analyse la constitution de la « cons- 
cience » comme région privilégiée et fondatrice de toute 
expérience, systématiquement explorée dans les Médita- 
tions cartésiennes, qui s'offrent comme un recommence- 
ment radical de la philosophie, comme (d'après J. T. De- 
santi) l'effort le plus têtu de Husserl, et peut-être de 
toute la tradition rationaliste occidentale, pour ressaisir 
et repenser le projet d'une fondation des mathématiques, 
et par suite des sciences, ailleurs qu'en elles-mêmes, sur 
une évidence ultime, apodictique (universelle et néces- 
saire), en tant qu’ « intuition » (ou évidence) pure, et 
pour cette raison susceptible de servir de support à des 
jugements apodictiques. 

Tous les cas considérés ici — on a laissé de côté la 
tradition empiriste qui est, sous sa forme ancienne et 
classique, condamnée dès l'origine à la stérilité sur ce 
point, puisqu'elle professe que les concepts mathéma- 
tiques résultent d'une genèse empirique jamais démontrée, 
ou prouvée, ou construite — procèdent à un essai de 
subordination du savoir mathématique, à son enracine- 
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ment dans un sol que met à nu une analyse soit dialectique, À La Phi 
soit métaphysique, soit transcendantale. Bien que rien 
de commun ne relie la nécessité de déployer le contenu 
lui-même du savoir à celle de définir a priori ses condi- 
tions de possibilité, on trouve à la racine de tous ces 
projets l'idée que le savoir mathématique a des secrets 
que seule peut livrer la philosophie. Bref, qu'il ne vaut que 
dans la mesure où il peut être « intériorisé » par un dis- 
cours distinct de lui, et qui le dépasse. 


(XIVe siè 


Le rôle actif de la philosophie : 
l'idée de discours démonstratif 


Mais reconnaître la tendance et le caractère « intériori- 
sateurs » et « assimilateurs » de l'investigation philo- 
sophique traditionnelle ne devrait pas occulter le fait que 
la forme de vérité visée dans cette investigation a, en fait, 
des rapports plus complexes avec la mathématique comme 
théorie, et l'idée de théorie comme propriété permanente 
du rationnel et du scientifique. À cet égard, il y a si peu 
de discontinuité et de contraste entre l'exigence philo- 
sophique et l'exigence mathématique qu'à l'origine, 
c'est la mathématique qui a, pour ainsi dire, assimilé et 
intériorisé le projet philosophique. 


L'Antiquité grecque 

En effet, il est au moins une chose bien certaine, c'est 
que la figure de la mathématique grecque, où l'idée de 
mathématique s'est identifiée à celle de démonstration, 
est fondamentalement différente de la mathématique 
d'origine égyptienne et babylonienne. Ce qui fait cette 
différence, c'est sans doute, non le caractère rigoureux, 
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dans la mesure où une technique pure peut bien 
être rigoureuse, mais le caractère méthodiquement dis- 
cursif, l'idée d'un système hypothético-déductif, c'est-à- 
dire fondé sur des hypothèses de départ explicites, dites 
axiomes ou postulats, dont on examine les conséquences 
logiques. D'où la mise en œuvre d'une technique démons- 
trative tellement précise et rigoureuse qu'elle reste encore 
pour nous un modèle de rigueur. Une technique : Euclide 
procède toujours à partir d'un énoncé qui est donné 
comme hypothèse, qu'il explique par un cas « concret » 
pour ensuite le prouver, le démontrer. La démonstration 
est ici le moment le plus important, le plus spécifique des 
textes mathématiques grecs. Or, elle est reliée à une ten- 
dance profondément hostile à l'expérience et à l'intui- 
tion, exprimée avec force par Platon qui veut que l'énoncé 
arithmétique porte « sur les nombres en tant que nombres, 
sans admettre d'aucune manière qu'on fasse ce discours 
en lui proposant des nombres pourvus d'un corps visible et 
tangible » (République, 525 d). Il y a donc une science 
des nombres à partir du moment où l’on tourne le dos à 
l'arithmologie figurée. I y a une science des nombres dans 
la mesure où le nombre ne se confond pas avec les 
nombres concrets. D'ailleurs, cela vaut exactement pour 
la géométrie : elle nous intéresse, non parce qu'elle sert 
« pour l'établissement d'un camp, pour le siège d'une 
place, pour la concentration ou le déploiement d'une 
armée, ou pour tout ce qu'encore un plan de bataille, 
un ordre de marche comportent en eux-mêmes de figures », 
mais parce qu'elle « force à contempler la réalité » (Répu- 
blique, 526 d-e), dans la mesure où celle-ci n'est ni l'uti- 
lité, ni la technique des figures « visibles et tangibles », 
qui ne peuvent en aucun cas fournir le point de départ 
à la géométrie comme science. Pour cette raison, 
Euclide, fidèle à la tradition exprimée par Platon, mani- 
feste constamment le souci d'affranchir autant que 
possible ses définitions et ses démonstrations de toute 
représentation tactile ou visuelle. [| ne considère pas 
telle ou telle figure, mais toutes les figures de tel type : 
Dans tout parallélogramme, dira-t-il, /es compléments des 
parallélogrammes situés de part et d'autre de la diagonale 
sont équivalents entre eux. Où encore : Toute pyramide 
à base triangulaire peut être divisée en deux pyramides 
à base triangulaire équivalentes et semblables (c'est-à- 
dire égales) entre elles et semblables à la pyramide 
entière, et en deux prismes équivalents, et la somme des 
deux prismes est supérieure à la moitié de la pyramide 
entière. Si l'on considère tout parallélépipède, toute 
pyramide, c'est que ce n'est pas ce parallélépipède ni 
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cette pyramide qui donnent la preuve exigée par la 
géométrie. C'est donc en persévérant dans la voie de 
l'épuration logique, de la rigueur démonstrative, en réali- 
sant une intention qui anime l'écriture mathématique 
d'Euclide, que Leibniz remarquera plus explicitement 
encore que : « La force de la démonstration est indépen- 
dante de la figure tracée, qui n'est là que pour faciliter 
l'intelligence de ce qu'on veut dire et fixer l'attention: 
ce sont des propositions universelles, c'est-à-dire les 
définitions, les axiomes et les théorèmes déjà démontrés 
qui font le raisonnement et le contiendraient quand la 
figure n'y serait pas. » C'est pourquoi, déjà, J. Schenbelius 
et C. Herlinus ont, dès le XVI° siècle, l'un donné des 
figures sans leurs lettres, l'autre réduit les mêmes démons- 
trations en syliogismes et prosyliogismes. Incontestable- 
ment, logique et mathématique sont liées chez Euclide, 
bien que la logique ne se révèle que par l'exigence, encore 
non satisfaite, d'un discours pur, que ne justifient ni 
l'expérience visuelle, ni le souci de formules utiles per- 
mettant l'évaluation d'une aire où d'un volume, ni le 
recours à l'intuition. 

Une théorie extrêmement séduisante a été développée 
par l'historien A. Szabé pour expliquer cet état de fait : 
elle consiste à mettre en rapport l'anti-empirisme et 
l'hostilité à l'intuition avec la découverte du raisonnement 
indirect. Cette thèse a le mérite de souligner que le raison- 
nement indirect n'est ni intuitif ni empirique, et qu'il ne 
recourt ni au « visible », ni au « tangible », ni même au 
calculable. Mais elle suggère également que, si les pre- 
miers mathématiciens ont recouru à cette technique, 
c'est parce que les monstrations, empiriques et intui- 
tives, ne les satisfaisaient plus. Ainsi, jamais l'attitude 
spontanée ou commune n'aurait pu concevoir l'échec 
des tentatives empiriques en vue de déterminer une mesure 
commune entre la diagonale du carré et son côté. Il 
fallait s'apercevoir que la nécessité d'admettre l'existence 
de grandeurs géométriques incommensurables entre elles 
est absolument incontournable, si incontournable que, 
derechef, on doit produire le concept d'incommensura- 
bilité, qui ne vaut que dans la mesure où « côté », « dia- 
gonale », « carré » ont acquis le statut d'objets mathé- 
matiques, c'est-à-dire une « réalité » du même type que 
celle de |’ « objet » qui s'est révélé incommensurable. La 
technique de preuve induit un nouvel objet dont la 
nature exige que les anciens objets soient repensés 
conformément à la nature qu'ils révèlent. C'est en cela 
que consiste ce qu'on a appelé « révoiution » ou « miracle » 
grec. 


Palais de la Découverte 


Mais cet abandon de l'expérience dans des disciplines 
qui tiraient leur prestige de leur utilité n'est-il pas 
étonnant? Certes. Soulignons bien, avant de donner 
une explication de ce phénomène, la place de choix 
que le raisonnement indirect occupe dans les Éléments 
d'Euclide. Il y a tout lieu de penser qu'au temps de 
Platon, il fut considéré comme la preuve mathématique 
par excellence. Ainsi, c'est après avoir, grâce à un 
raisonnement indirect, mis Théétète dans l'embarras, 
que Socrate semble réclamer autre chose que des argu- 
ments vraisemblables « dont l'usage en géométrie ferait 
que Théodore (maître de Théétète et géomètre lui- 
même) ne vaudrait pas même un seul liard s'il y recourait ». 
Comment alors expliquer ce fait? Et cet autre qui l'ac- 
compagne : l'orientation anti-empirique ? Il est difficile 
de croire que, spontanément, une mathématique empi- 
riste se soit muée en théorie d'idéalités mathématiques. Il 
est difficile, lorsqu'il s’agit de la naissance des mathé- 
matiques en Grèce, et donc de l'idée de démonstration, 
de faire abstraction de l'influence de la doctrine éléatique. 

Les philosophes d'Élée se caractérisent, en effet, par 
le mépris qu'ils professèrent pour tout ce qui est empi- 
rique. La vérité, selon Parménide, ne peut être saisie que 
par la pensée (Oéye), Et c'est Parménide qui, le premier, 
applique les principes logiques de la non-contradiction 
et du tiers exclu pour établir que l'être ne peut être soumis 
à la génération. Car, ou bien il se serait produit à partir 
d'un être, ou bien d’un non-être. Dans le premier cas, 
il y aurait eu un être avant l'être; dans le second, un être 
qui aurait été un non-être. || en résulte, par un raisonne- 
ment typique et spécifique des Éléates, que l'être n'est 
pas soumis au devenir. Après Parménide, Zénon, auquel 
on attribue les fameux paradoxes, est un des plus illustres 
représentants de cette école de pensée. C'est pourquoi 
Aristote le considère comme le créateur de la dialectique, 
et l’on peut considérer la dialectique comme la créatrice 
des mathématiques, comme l'institutrice de l'usage des 
hypothèses, et, pour tout dire, de la méthode hypothético- 
déductive. Si bien qu'il apparaît qu'à l'origine, la mathé- 
matique n'était qu'une branche développée de la dialec- 
tique. C'est ce que peut montrer une analyse philosophique 
du vocabulaire des mathématiques grecques, à laquelle 
a procédé A. Szab6, et que nous ne pouvons ici examiner 
dans le détail. 

Ce qui est certain, c'est que le souci, typiquement 
grec, de logique dans une discipline comme les mathé- 
matiques a conduit à la création d'une logique, c'est-à-dire 
d'un exemple de discipline démonstrative non mathé- 
matique fcf. la partie historique du chapitre sur /a 
Logique). En effet, « la logique est aussi susceptible de 
démonstrations que la géométrie, dira plus tard Leibniz, 
et l'on peut dire que la logique des géomètres ou les 
manières d'argumenter qu'Euclide a expliquées et éta- 
blies en parlant des propositions sont une extension ou 
promotion particulière de la logique générale ». L'œuvre 
logique d'Aristote, inventeur de la logique formelle, appa- 
raît à Kant, selon une formule devenue célèbre, si parfaite 
que, depuis son fondateur, elle n'aurait fait « aucun pas 
en avant et que, par conséquent, selon toute apparence, 
elle semble close et achevée ». Ce jugement est certes 
aujourd'hui dépassé. Mais cela ne peut faire oublier 
qu'Aristote a précisé l'idée de déduction en énumérant 
quelques règles valides, et qu'il a doté en outre la logique 
d'une sorte d'axiomatisation. Qui plus est, il semble 
n'avoir médité sur les règles du raisonnement qu'en 
songeant à établir les principes de la discussion. Ainsi, 
bien que le terme dialectique aït chez lui un sens différent 
de celui de Zénon ou de Platon, c'est en vue de régle- 
menter une dialectique envahissante qu'est née la 
logique d'Aristote. ° 


Le renouveau du XIXe siècle 

Il ne serait pas exagéré de dire que la renaissance de 
cet esprit d’alectique au XIXe siècle n’a pas été étrangère 
aux retrouvailles entre logique et mathématique. Mais 
cet esprit dialectique n'a rien à voir avec la dialectique 
hégélienne; il se nourrit plutôt de l'exigence de faire 
revivre la philosophie dans l'horizon même de la mathé- 
matique. Ou, si l’on veut, c'est dans la mathématique 
elle-même que se ressent le besoin d'une réflexion logique 
et philosophique. 

Pour comprendre cette situation, il nous faut d'abord 
rappeler que toute l'originalité de la mathématique 


moderne consiste à avoir introduit l'idée de variation. Il 
n'en pouvait être question dans l'Antiquité grecque : ia 
critique que Platon adresse aux géomètres de son temps 
exprime une exigence respectée ; elle consiste à dénoncer 
l'inadéquation entre la nature de la science et le langage 
employé par ceux qui la manient. « Leur langage, dit 
Platon, dans /a République (527 a), est, je pense, tout à 
fait risible et sent la servilité; car, tenant un langage 
qui est celui de gens qui pratiquent une action et dont la 
pratique est le but, ils parlent de « carrer », de « tendre le 
long de », de « poser au plus de » [...] alors que cette 
étude est tout entière une occupation dont /a connais- 
sance est le but. » Mais la mathématique moderne ne 
renie pas ce que les mathématiciens grecs connaissaient 
sans lui reconnaître de statut théorique. Au cours, donc, 
du XVII siècle, cette idée de variation s'impose. Elle 
conquiert un statut mathématique par la notion de 
fonction « qui s'introduit, remarque Bourbaki, à juste 
titre, et se précise d'une foule de manières au cours du 
XVIIS siècle », car, ajoute-t-il, « toute cinématique repose 
sur une idée intuitive, et, en quelque sorte, expérimentale, 
de quantités variables, avec le temps, c'est-à-dire de 
fonctions du temps ». 

Le temps dans les mathématiques? Il y a là de quoi 
scandaliser les amoureux de la rigueur, surtout depuis 
que la notion de fonction devait être, au XIX® siècle, 
élargie de manière que, par l'expression y — f(x), on ne 
comprenne rien d'autre que le pur concept de l'opération 
« f » faisant correspondre au système des objets « x » le 
système des objets f(x). Dirichlet disait, dès 1837, qu'il 
n'est pas nécessaire que y dépende de x selon la même loi; 
il n'est même pas nécessaire d'avoir une dépendance 
exprimable par des opérations algébriques. Épurer les 
mathématiques, « omnitemporelles » par excellence, 
de leur « chute » dans le temps, devenait ainsi une entre- 
prise mathématiquement pensable, aussi bien que logi- 
quement nécessaire. Dans cette voie s'était déjà avancé 
B. Bolzano qui déclare péremptoirement dans ses fameux 
Paradoxes de l'infini (1850), lorsqu'il critique (8 12) 
la notion d'infini telle qu'elle est exposée par l'article 
Infini du dictionnaire de Klugel, que même nos mathéma- 
ticiens éminents, comme Cauchy, se sont trompés en 
pensant l'infini « comme une grandeur variable dont la 
valeur croît indéfiniment et, par suite, devient plus grande 
que toute grandeur donnée aussi grande qu'elle soit ». 
La limite de cette croissance infinie serait la grandeur 
infiniment grande. Ce qui est erroné dans cette défi- 
nition éclate à partir du fait que ce que les mathématiciens 
appellent une grandeur variable n'est pas à proprement 
parler une grandeur, mais le pur et simple concept, la 
pure et simple représentation d'une grandeur qui n'est 
pas unique mais qui comporte un ensemble infini de 
grandeurs, de valeurs distinctes ». Évidemment, cette thèse 
de Bolzano n'acquiert toute sa portée que si le domaine 
infini des nombres réels est correctement construit. 
Cependant, grâce à la mise au jour du soubassement 
ensembliste de l'analyse classique, il aboutit à éliminer de 
l'idée de fonction toute idée de variable au sens intuitif, 
liée généralement à la notion de temps. 

Or, Bolzano est à la fois un philosophe, qui s'est 
intéressé aux mathématiques parce qu'on s'y donnait 
la peine de démontrer des choses évidentes, et un 
mathématicien. | a voulu allier les exigences de la philo- 
sophie et des mathématiques, et c'est dans cette asso- 
ciation qu'il a pu réveiller l'intérêt pour la logique chez 
les mathématiciens, et l'intérêt pour les mathématiques 
chez les logiciens, à un moment où les logiciens se 
recrutaient essentiellement parmi les philosophes. 

Toutefois, le plus curieux dans l'histoire, c'est que ce 
moment « bolzanien » de la mathématique moderne 
reproduit les éléments essentiels de la mathématique 
ancienne. En effet, Bolzano est philosophiquement pla- 
tonicien. Il croit, comme Weierstrass plus tard, à l'exis- 
tence en soi des êtres mathématiques; il est anti-empiriste 
parce que le souci logique le pousse à mettre en lumière 
le fondement des mathématiques qu'il découvre lié 
à des notions que l'expérience ne peut fournir : par 
exemple, l'infini actuel; enfin, il utilise le raisonnement 
indirect, dans l’idée que ce qui n'est pas contradictoire 
est vrai (voir dans le chapitre Logique les précisions qu'a 
apportées la logique moderne sur ces deux notions) 
et que de la non-contradiction à l'existence, la consé- 
quence est bonne. 
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C'est encore plus résolument que le fondateur de la 
logique et de la philosophie contemporaines, G. Frege, 
s'est engagé sur cette voie de l'association philosophico- 
mathématique, mariage dont est née la logique mathé- 
matique pour laquelle Boole, d'une certaine façon, n'a pas 
fait plus que Leibniz. Or, l'originalité de Frege est d'avoir 
continué l'analyse et poursuivi l'élargissement de la 
notion de fonction jusqu'à créer une jonction réelle entre 
mathématique et logique, qui lui a permis, dans une 
entreprise partiellement manquée, de reconstruire logi- 
quement la mathématique ou ce qui, de celle-ci, se rédui- 
sait à l'arithmétique des entiers naturels, ce qui n'était 
pas encore, du temps de Frege « rigoureusement » réalisé 
pour la géométrie. Or, Frege est, comme Bolzano, plato- 
nicien : « Que trois tombe sous le concept de nombre 
premier est une vérité objective; ce n'est pas une idée 
que je trouve en moi; c'est un fait toujours et objective- 
ment valable, que nous dormions ou veillions, que nous 
le pensions ou pas. » Mais il est, en outre, comme on sait, 
logiciste, c'est-à-dire que, pour lui, les ressources logiques 
sont nécessaires et suffisantes pour penser l'arithmétique 
et tout ce qui peut se construire à partir d'elle, c'est-à-dire 
beaucoup de choses. 

Il ressort de ces indications que la mathématique a 
partie liée avec la philosophie au moins dans ses moments 
cruciaux : celui où elle naît, où naît l'idée de démonstra- 
tion, et celui où elle renaît pour réinvestir cette ancienne 
idée de la rigueur dans les nouveaux domaines conquis 
depuis le XVII siècle, c'est-à-dire essentiellement le 
calcul infinitésimal, et plus généralement l'analyse. Nous 
avons soigneusement laissé de côté le fait, somme toute 
contingent, qu'au XVII® siècle, certains philosophes 
étaient mathématiciens : Descartes et Leibniz l'attestent, 
dont les philosophies mathématiques respectives dépen- 
dent de la mathématique que chacun avait en vue. Mais 
les mathématiques se sont développées après eux avec 
autant de rapidité que de désordre. 

C'est après cette floraison technique que reparut l'exi- 
gence de tout remettre en ordre, d'entreprendre la révision 
des principes, de dépasser les vues directement reliées 
aux applications, de substituer, comme disait Lejeune- 
Dirichlet, les idées au calcul. Cette substitution, ce retour 
au concept n'allaient cependant pas s’accomplir sans 
difficultés. Ils sont à l'origine de la problématique des 
fondements. 


La fondation de la nouvelle philosophie 


Si l'on considère les discussions du début de ce siècle 
sur les mathématiques, on s'aperçoit, à les comparer 
avec les philosophies mathématiques de Descartes et de 
Kant, qu'elles ont pour ainsi dire élargi l'horizon de la 
réflexion philosophico-mathématique. L'idée de mathé- 
matique a pris comme un nouveau départ, et les différentes 
élaborations qu'elle a suscitées apparaissent comme 
autant de manifestations décisives des ressorts de la philo- 
sophie mathématique contemporaine dans la mesure où 
elle a rendu la philosophie à son lieu, aux mathématiques, 
à un lieu dont le seul problème est de savoir s'il se main- 
tient et comment, mais qui incontestablement est élaboré 
et produit par G. Frege. 

D'abord, ce n'est donc pas un hasard si G. Frege cons- 
tate, dans ses Fondements de l'arithmétique (1884), que 
son « exposé a pris un tour plus philosophique qu'il ne 
semblera à beaucoup de mathématiciens. une recherche 
fondamentale sur le concept de nombre ne peut manquer 
d'être marquée de philosophie. La tâche est commune 
aux mathématiques et à la philosophie ». S'il s'est engagé 
dans cette voie, ce n'est pas parce qu'il a dû professer, 
comme nous l'avons déjà indiqué, que les nombres sont 
des êtres mathématiques existant indépendamment de la 
pensée humaine et constituant un monde qui n'a pas 
besoin d'être fondé par autre chose que la logique pour 
pouvoir être compris; c'est également pour deux autres 
raisons, plus essentielles. 

La première concerne la signification de l'œuvre /ogique 
de Frege, inaugurée par la Begriffsschrift (1879) ou 
idéographie, l'ouvrage de logique le plus original et le 
plus profond depuis Aristote. Dans l'esprit de Frege, 
cette idéographie conduisait naturellement à élaborer une 
théorie générale des suites (Reihenlehre) dans le dessein 
de montrer que le principe de récurrence, l'un des axiomes 
de l'arithmétique, peut être élucidé de manière purement 
logique. Ce faisant, il montrait, contre la logique alors 
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dominante (on est en 1879), celle de S. Mill, que 
l'empirisme n'a pas son mot à dire dans ce domaine. 
Qu'il est oiseux, voire incongru, de chercher dans les 
théories empiriques de l'induction une explication à 
l'induction complète. Du coup, et pour la première fois 
de manière convaincante, le rapport entre les mathé- 
matiques et les sciences de la nature se trouve irrémé- 
diablement rompu, et rend impossible toute référence 
à la nature, à la physique ou à la subjectivité, auxquelles 
on recourait quand l'essentiel de la philosophie consistait, 
de Descartes à Kant, à expliquer le monde de l'expérience. 

La seconde se rapporte à la perspective philosophique 
propre à Frege. Celle-ci est originale au sens fort. Elle 
constitue l'humus et l'horizon de la philosophie post- 
frégéenne, dans la mesure où elle a contraint le néo- 
kantisme, la phénoménologie naissante, la pensée ana- 
lytique dans ses versions linguistique et épistémologique, 
à tenir compte de ses interrogations. Or, pour Frege, 
comme l'a souligné son meilleur commentateur, M. Dum- 
met, la première tâche de la philosophie, ou plus exacte- 
ment de l'enquête philosophique, c'est l'analyse du 
sens. Mais qu'est-ce que le sens? R. Thom, proche d'une 
inspiration frégéenne, nous dit : « Tout mathématicien 
doté de tant soit peu d'honnêteté intellectuelle reconnaîtra 
que, dans chacune de ses démonstrations, il est capable 
d'attacher un sens à chacun des symboles qu'il manifeste : 
en cela, il diffère du physicien théoricien, qui, très fré- 
quemment, n'hésite pas à se confier magiquement aux 
vertus du formalisme aveugle dans l'espoir — souvent 
déçu — que les lumières de la fin dissiperont les ténèbres 
du commencement . » Certes, cela veut dire que les 
mathématiques ont un contenu propre, et cela dit ce 
que Frege voulait dire. Mais la portée de l'analyse du 
sens qu'il institua va plus loin : il s’agit de montrer que 
toute thèse philosophique est dénuée de sens tant que 
l'on ne s'est pas entendu sur l'analyse du sens de 
certaines expressions. Il faut avant tout élucider le 
sens des expressions en jeu dans un problème pour 
pouvoir le poser, pour pouvoir se demander si ce qu'on 
dit est vrai et pour quelles raisons cela le serait. Autre- 
ment, il se peut qu'interviennent non seulement des 
différences de style dans l'analyse, mais des malentendus 
sur ce dont il est question, sur la chose analysée elle- 
même. La philosophie est alors œuvre d'élucidation, 
d'explicitation du langage. Par suite, il nous faut savoir 
comment travaille le langage, et donc établir la manière 
correcte de son fonctionnement. Autrement dit, il nous 
faut construire une théorie logique, et une théorie logique 
qui soit conforme à la philosophie du sens, une théorie 
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de la définition et de l’inférence valide qui satisfasse 
l'exigence de cette philosophie, une théorie de la vérité 
qui rende compte de la manière dont elle se rapporte 
à — et utilise — les procédures du langage. Donc quelque 
chose, en fin de compte, d'encore plus profond que ce 
qu'on exige pour que le discours mathématique usuel 
soit entendu, c'est-à-dire de plus profond qu'une séman- 
tique ensembliste. 

Il y a comme l'ouverture à une ontologie précise dont 
on ne peut pas dire qu'aujourd'hui les problèmes soient 
clos. On a comme l'écho du grand désir de Platon de 
parvenir « à un principe qui se suffise » (Phédon, 101 e). 
Mais l'écho seulement. Car il ne s'agit pas de produire 
une dialectique supérieure au discours qu'elle analyse, 
mais d’asseoir, analytiquement, pas à pas, le discours 
analysé sur le langage qu'effectivement il implique. 


Le problème des fondements 
des mathématiques 


Mais la perspective, enfin mise au jour par Frege, 
n'était pas simple. Il ne s'agissait pas seulement de spécu- 
ler à nouveaux frais à partir de cette interrogation origi- 
naire, mais d'établir précisément l'arithmétique sur autre 
chose que le hasard des signes, sur des lois logiques 
vraies. Or, au bout de cette entreprise enfin réalisée dans 
les monumentales Grundgesetze der Arithmetik, s'est 
découverte une antinomie communiquée à Frege par 
une lettre célèbre de B. Russell. 


Les paradoxes 


Découverte en même temps, et sous une autre forme, 
par Cantor (1899) et par Zermelo, l'antinomie de 
Russell fut suivie par la mise au jour d'autres paradoxes, 
parmi lesquels on distingue aujourd'hui ceux qui sont 
de nature /ogique et ceux qui sont de nature séman- 
tique. 

A titre d'exemple, disons brièvement en quoi consiste le 
paradoxe de Russell (1902) : on appelle ensemble une 
collection arbitraire d'objets qui sont dits appartenir à cet 
ensemble. Les ensembles peuvent appartenir à, ou, en 
d'autres termes, être éléments d'autres ensembles. Mais un 
ensemble peut-il s'appartenir à lui-même ? Non,sans doute, 
car l'ensemble des chats n'est pas un chat. Pourtant, il 
existe des ensembles qui peuvent s'appartenir à eux- 
mêmes : l’ensemble de tous les ensembles. Si l'on consi- 
dère E comme l'ensemble des ensembles F tel que F 
n'est pas un ensemble de lui-même, il en résulte que E 
est un élément de E si et seulement si E n'est pas un 
élément de E. 

La nature des paradoxes est soit purement mathé- 
matique, exigeant alors une reconstruction de la théorie 
des ensembles jusqu'alors disponible dans les premiers 
travaux de Cantor, soit plutôt épistémologique, exigeant 
une logique qui précise le sens de la notion de vérité, 
de désignation, d'expressibilité, etc. C'est précisément 
ce qui montre que la philosophie mathématique va 
s'engager nécessairement sur deux voies appelées à se 
conjoindre et à se consolider mutuellement : mathéma- 
tique (ensembliste) et logique. 


Le logicisme 


Le logicisme, c'est la reprise de la thèse de Frege. Mais, 
dans la version de B. Russell, cette thèse professe que 
toutes les mathématiques se réduisent à la logique ; et cela 
est affirmé dans l'horizon nouveau constitué par la néces- 
sité de reconstruire l'édifice mathématique en évitant les 
antinomies. En ce sens, le logicisme est un réductionnisme. 
Il confond en une les deux solutions exigées par la 
théorie des ensembles : la solution mathématique et la 
solution sémantique. Logique et mathématiques sont 
donc une seule et même chose : la logique mathématique ; 
ce qui met en relief le caractère mathématique de la nou- 
velle logique, qu'on peut distinguer de la mathématique 
pure, comme le montre l'œuvre gigantesque des Principia 
mathematica (1910-1913), dont les trois volumes, rédigés 
en collaboration avec Whitehead, ont été la Bible des 
logiciens mathématiciens jusqu'aux premiers manuels 
de logique dus aux disciples de Hilbert : celui de Hilbert- 
Ackermann (1928) et celui, plus important, de Hilbert- 
Bernays (1934-1939). 

Mais l'intérêt de la position logiciste ne vient pas tant 
de son caractère plus philosophique que technique, que 


du fait que ce caractère est lui-même à l'origine d’une 
investigation systématique sur les paradoxes, qui a con- 
duit, comme l'a remarqué Güôdel, à la mise en lumière du 
caractère contradictoire de nos intuitions logiques, et à la 
constitution d'une « doctrine des types » (B. Russell in 
Principles of Mathematics, 1903, App. B). 

La distinction entre les types logiques semble, pour 
B. Russell, fournir la clef du mystère. Nous pouvons 
remarquer tout d'abord que cette distinction introduit des 
différences entre les divers niveaux des concepts. Par là, 
elle met en œuvre une analyse du sens — ou de la signi- 
fication — conformément à l'exigence de Frege. Mais 
cette analyse semble animée par un style philosophique 
bien classique dont on trouve l'équivalent chez Aristote. 
Si « on résout les arguments qui sont de véritables raison- 
nements en les détruisant », on résout « ceux qui sont 
seulement apparents en faisant des distinctions » (Réfu- 
tations sophistiques, 1766). 

Mais que doit signifier une analyse des significations, 
après la découverte des antinomies logiques, plus sérieuses 
qu'apparentes, et qui, de plus, semblent mettre en doute le 
sens commun, voire la logique elle-même qui, disait 
Poincaré, « n'est plus stérile [puisqu'] elle engendre des 
contradictions »? La théorie des types rémédiait à cette 
fâcheuse situation dans la mesure où elle permettait de 
faire disparaître ce qui semblait à Russell la racine des 
contradictions : les définitions imprédicatives qui dis- 
tinguent les éléments d'un ensemble par des termes qui se 
réfèrent à cet ensemble, autrement dit, qui emploient 
le quantificateur universel sans précaution. Sans entrer 
dans des détails de peu de sens pour ce propos, on dira, 
étant donné une fonction propositionnelle #(x), qu'ilexiste 
un certain nombre de valeurs de x pour lesquelles cette 
fonction a un sens, c'est-à-dire est vraie ou fausse. Soit a 
l'une de ces valeurs, alors © (a) est une proposition vraie ou 
fausse. Mais © (x) peut également être toujours vraie ou tou- 
jours fausse. Ainsi, « si x est humain, x est mortel » est tou- 
jours vraie, mais « x est humain » l'est seulement quelque- 
fois. Donc une fonction propositionnelle (on désigne par là 
une formule ouverte, c'est-à-dire qui contient des variables 
libres; cf. le chapitre Logique) peut être considérée de 
trois manières : soit en substituant une constante à une 
variable, soit en affirmant toutes les valeurs de la fonction, 
soit en affirmant certaines valeurs seulement. Pour éli- 
miner les contradictions dans le cadre du « sens commun », 
il faut, lorsque j'affirme toutes les valeurs d'une fonction 
o(x), que le domaine des valeurs de x soit bien déterminé, 
« c'est-à-dire, écrit Russell, qu'il doit y avoir une totalité 
quelconque de valeurs possibles de x. Si maintenant je 
crée, ajoute-t-il, des valeurs définies en termes de cette 
totalité, la totalité paraît, de ce fait, agrandie, et c'est 
pourquoi les nouvelles valeurs qui s'y réfèrent se référe- 
ront à une totalité agrandie. Mais puisqu'elles doivent 
être comprises dans cette totalité, celle-ci ne peut jamais 
les rattraper. C'est comme d'essayer de sauter sur l'ombre 
de votre tête » (Histoire de mes idées philosophiques, 
Gallimard, 1961, p. 102). Lorsque le menteur dit : « Je 
mens », s'il dit par là : « Tout ce que j'affirme est faux », 
cette assertion se réfère alors à la totalité de ses assertions, 
et c'est seulement dans cette mesure que se produit le 
paradoxe. Or, il est possible de définir une hiérarchie de 
propositions telle que celles du premier ordre ne se 
réfèrent pas à la totalité des propositions du premier ordre. 
Une fonction propositionnelle ne peut plus, ainsi, se 
prendre elle-même comme valeur de son argument. Le 
menteur pourra alors bien dire : « J'affirme une fausse 
proposition de premier ordre qui est fausse. » Mais cette 
proposition, dit Russell, « est elle-même une proposition 
de second ordre. || n’affirme donc ainsi aucune proposition 
de premier ordre. Ce qu'il dit est ainsi tout simplement faux, 
et l'argument selon lequel c'est également vrai tombe ». 
Ainsi, la théorie des types s'attaque à la raison des para- 
doxes : elle élimine leur risque en supprimant la possibi- 
lité de cette « référence à soi réflexive » qui comprend 
« comme membre d'une totalité, quelque chose qui se 
réfère à cette totalité qui ne peut avoir un sens défini que 
si la totalité est déjà fixée ». L'élimination des paradoxes 
en résulte, car, désormais, il est impossible de confondre 
la relation d'appartenance d'un élément à un ensemble 
et la relation d'inclusion d'une partie d'un ensemble 
dans un autre. Les quantificateurs ne pourront se rap- 
porter qu'à un type déterminé de variables, jamais à 
tous les types possibles. 
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Toutefois, l'ensemble des mathématiques n'est pas 
encore sauvé. Pour ce, il a fallu introduire le fameux 
axiome de réductibilité dont Wittgenstein disait que, 
s'il était vrai, ce serait par hasard qu'il le serait. Cet 
axiome, permettant dans la version ramifiée des types 
(nous n’examinons pas toutes les versions de cette théorie) 
de considérer toute fonction propositionnelle d’un niveau 
quelconque comme ayant la même extension qu’une 
fonction propositionnelle élémentaire, semble réintro- 
duire par une porte de derrière des définitions imprédi- 
catives. 

Quoi qu'il en soit, la contribution du logicisme à l’ana- 
lyse du langage est décisive. La solution aux antinomies 
a été à l'origine également de la théorie des descriptions, 
dont le point central est qu'une expression « peut contri- 
buer au sens d'une phrase sans posséder aucun sens quand 
elle est seule ». 

Par là aussi, elle satisfaisait un requisit de l'analyse 
frégéenne : qu'on doit chercher ce que les mots veulent 
dire non pas isolément mais pris dans leur contexte. 
Ce principe du contexte, produit par et pour une réflexion 
philosophique, n'a pas été seulement déterminant dans la 
philosophie analytique, qui a pris ses distances envers 
la logique, mais reste parfois actif dans une réflexion 
purement technique, qui s'est libérée de l'horizon logi- 
ciste, sans le renier. Car les théories des types essayées 
par H. Wang et Lorenzen ont rendu caduques les vieilles 
objections, et l'idée d'une distinction entre les différentes 
couches du langage a donné à une vieille idée philoso- 
phique des interprétations exactes intéressantes, au- 
delà des frontières logicistes. En effet, l'idée, par exemple, 
de distinguer entre catégories différentes d'objets n'est 
pas absente même de la fondation de la théorie des 
ensembles de Newman-Bernays où deux univers dis- 
joints sont admis, celui des classes et celui des ensembies. 
Mais il y a davantage, il est possible aujourd'hui de passer 
d'une théorie pluricatégoriale (qui admet plus d'une 
sorte d'objets fondamentaux) à une théorie monocatégo- 
riale (qui n’admet qu'une seule sorte d'objets). Ce qui 
est une manière, non seulement d'apprécier la valeur 
interne d'un style d'analyse logique, mais aussi d'être 
plus sûr quant à sa validité, à un moment où les philoso- 
phies se sont si fondues dans les techniques qu'il faut 
une multiphilosophie pour comprendre ces techniques, 
enracinées, pour les plus récentes, dans une pensée 
logique encore grosse d'avenir. 


Le formalisme 


Mais il fallait que le logicisme se rendit compte qu’ «avec 
l'infini commence la véritable mathématique », autre- 
ment dit que l'essentiel était, après les antinomies, de 
fonder l'analyse telle que la pratique le mathématicien, 
et en sorte que son travail pût se poursuivre dans la séré- 
nité. « Dans sa fondation de l'analyse, Weierstrass, disait 
Hilbert, a accepté sans réserve et utilisé à maintes 
reprises ces formes de déduction logique dans lesquelles 
le concept de l'infini entre en jeu, comme lorsqu'on traite 
de tous les nombres réels ayant une certaine propriété 
ou lorsqu'on démontre qu'il existe des nombres réels 
avec une certaine propriété. » Ce que Hilbert dit de Weier- 
strass, il pouvait le dire également de Dedekind, de Cantor, 
et d'autres mathématiciens qui ont vu surgir, sous leurs 
yeux, la nécessité de considérer des totalités infinies, 
autrement dit de manipuier l'infini actuel. 

Légitimer donc l'infini actuel, telle doit être la tâche 
immédiate du mathématicien. Cette tâche s'impose comme 
un choix à la pensée mathématique. Car elle ne semble pas 
la seule offerte. Outre qu'on peut bannir purement et 
simplement l'infini actuel, on peut aussi l’admettre de 
diverses manières. Ce sont donc plusieurs voies qui 
s'offrent. 

La première en date est celle de Zermelo. Elle puise 
à deux sources : 

— Zermelo s'inspire d'abord de Dedekind, qui avait 
élaboré une théorie des systèmes comme soubassement 
logique de sa théorie des nombres. Mais ce n'est pas 
seulement le matériau qui inspire Zermelo. Une idée pius 
profonde de Dedekind, plus profonde que le fait que les 
entiers naturels ou finis sont fondés sur l'existence 
d'ensembles infinis dénombrables, est qu'il utilise des 
axiomes (généralement attribués à Peano) pour définir 
ces entiers et les considère comme des conditions de 
structure sur des objets de nature non spécifiée. Ce type 
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de méthode, il l’a lui même introduit dans sa théorie 
des idéaux (on appelle « idéal » une sous-structure de la 
structure d’« anneau », qui permet notamment le passage 
à la structure « d'anneau quotient », de même qu'un sous- 
groupe d'un groupe [commutatif] permet de considérer 
le « groupe quotient »), qui l'avait déjà opposé à Kro- 
necker, dans les débuts de la seconde moitié du XIX® siè- 
cle. 

— Zermelo a pris, ensuite, une lecon décisive dansles 
Fondements de la géométrie de Hilbert qui est une réali- 
sation plus explicite encore de l'idée d'axiomatique 
moderne. Au liêu de définir l’objet dont traite une disci- 
pline mathématique, on part d’un certain nombre 
d'axiomes écrits à l'aide de symboles donnés, par exemple 
celui de la relation d'appartenance par le truchement 
de laquelle est signifiée l'existence de certains ensembles. 
L'ensernble des axiomes définit ainsi implicitement 
le concept d'ensemble, comme dans l'axiomatique for- 
melle de la géométrie où Hilbert n'admet pas d'avance 
les relations primitives comme déterminées dans leur 
contenu, car elles ne le sont que par les axiomes, et ne 
sont utilisées que par ce qui en est formulé expressément 
par les axiomes. D'une certaine manière, les axiomes ont 
ainsi force de définition, en ce sens que, au lieu de définir 
les notions de « point » ou de « droite » et de « plan » 
comme le faisait Euclide, non sans embarras, ils définis- 
sent des lettres appartenant à trois domaines d'individus 
distincts d’un calcul /ogique (dans le cas où l'on pousse 
la formalisation plus loin). Il en est à peu près de même 
de la théorie des ensembles de Zermelo, qui ne laisse 
plus de place aux antinomies. 

Dans l'horizon de ce nouveau style, il n'est plus directe- 
ment question de fonder les axiomes, dont celui de 
l'infini. Ce qui importe aux mathématiciens-techniciens, 
la réduction de la théorie des ensembles à quelques 
principes précisément formulés et soigneusement dis- 
tincts de toute préoccupation étrangère, est par là assuré. 
En particulier, la fondation de la théorie axiomatique 
des ensembles semble être du ressort d’un domaine 
différent : celui de la métamathématique. 

Mais cette solution technique implique deux attitudes 
philosophiques. 

L'une, implicite, a occupé aussi peu les philosophes 
que les mathématiciens, à l'exception du seul Desanti : 
c'est le problème des conditions d'une « reproduction » 
de théorie, qui est précisément une reproduction d'a- 
xiomes s'effectuant selon certaines modalités dialectiques 
du passage de l'implicite à l’explicite (/déalités mathé- 
matiques, Éd. Seuil, 1968). 

L'autre attitude concerne la philosophie explicite qui 
s'est immédiatement greffée sur le problème des théories 
axiomatiques et de leur fondation : le formalisme, préci- 
sément. 

En gros, le formalisme est d'abord une conception des 
mathématiques qui donne toute son importance à la 
notion de symbole, à laquelle elle tend à réduire la vieille 
notion d'être mathématique, qui n'y est plus de mise. 
« La condition préalable à l'application des raisonne- 
ments logiques... c'est que quelque chose, écrivait Hilbert, 
soit donné à la représentation : à savoir certains objets 
concrets, extralogiques, qui sont présents dans l’intui- 
tion en tant que données vécues, immédiates, préala- 
biement à toute activité de pensée. Pour que le raisonne- 
ment logique soit doué de solidité, il faut que l’on puisse 
embrasser ces objets du regard dans toutes leurs parties, 
et que l'on puisse reconnaître par intuition immédiate, 
en même temps que ces objets eux-mêmes, comme des 
données qui ne se laissent pas réduire à quelque chose 
d'autre, ou qui, en tout cas, n’ont pas besoin d'une telle 
réduction, la facon dont ils se présentent, dont ils se 
distinguent les uns des autres, la façon dont ils se suivent 
ou dont ils sont rangés les uns à côté des autres. Telle 
est la position philosophique fondamentale que je 
considère comme essentielle pour les mathématiques 
aussi bien que pour toute espèce de pensée, de compré- 
hension et de communication scientifique. En mathéma- 
tiques, en particulier, l'objet de notre examen, ce sont les 
signes concrets eux-mêmes dont la forme nous apparaît 
immédiatement avec évidence, conformément à notre 
position fondamentale, et demeure parfaitement recon- 
naissable. » Autrement dit, comme l’écrira encore Tarski, 
on peut considérer « les énoncés comme des inscriptions 
et par suite comme des corps physiques concrets » 


(textes cités par R. Martin, Logique contemporaine et 
Formalisation, P. U. F., 1964, pp. 28-29). Au commence- 
ment, disait encore Hilbert, il y a le signe. Comme si 
Hilbert supposait nécessaire, tout simplement, de savoir 
lire et écrire, inscrire et discerner des signes, pour prati- 
quer une science. 

Le formalisme s’est, ensuite, assigné la tâche de formali- 
ser toutes les mathématiques, tâche qu'a rendue possible 
leur axiomatisation. 

Toutes les mathématiques, au moins jusqu'au niveau 
atteint par les Principia mathematica de Russell et White- 
head, doivent pouvoir être reconstruites en systèmes 
formels, à partir de certains axiomes et à l'aide d'un 
certain nombre de règles d'inférence ; cela consiste donc 
à monter pour ainsi dire des mécanismes logiques où 
n'intervient jamais le sens des formules sur lesquelles 
on opère. 

Hilbert va plus loin. La notion de système formel, 
établie ainsi indépendamment de toute représentation, 
ne suffit pas. Il faut s'assurer que l'application des règles 
d'inférence aux axiomes ne conduit jamais à une contra- 
diction, c'est-à-dire qu'elle ne permet jamais de dériver 
à la fois a — b et a  b, ou 1 — 2. Cette assurance 
doit faire l'objet d'un métathéorème d'impossibilité 
soustrait au moindre doute; c'est un élément d'une méta- 
théorie qui étudie les démonstrations formelles et qui 
est donc une métamathématique ou théorie de la démons- 
tration. Dans cette dernière théorie, Hilbert emploie une 
arithmétique finitiste, mettant en œuvre « un raisonne- 
ment direct, pourvu de contenu, qui s'accomplit en 
expériences de pensée sur des objets donnés à l'intuition 
en dehors de tout présupposé axiomatique ». Il s'agit 
en fait d’une arithmétique concrète immédiate, acceptable 
par tous les mathématiciens, y compris ceux qui refusaient 
résolument de considérer une collection infinie comme une 
donnée actuelle. C'est donc une arithmétique minimale 
et philosophiquement neutre, mais qui n'a été élaborée 
que sur les principes philosophiques d'une conception 
formaliste muée en technique de formalisation, d'autant 
plus fondée qu'il y a un « parallélisme absolu, comme 
disait J. Herbrand (Écrits logiques, P. U. F., 1968, p. 37), 
entre le raisonnement mathématique et les combinaisons 
de signes », parallélisme qui rend naturelle l'étude des 
systèmes de signes pour eux-mêmes. Mais ce formalisme 
ne promet pas seulement de concilier toutes les écoles 
nées du refus de l'infini actuel, de son adoption, ou d'atti- 
tudes nuancées intermédiaires, il a l'ambition de restaurer 
l'idée de rigueur absolue historiquement attachée aux 
mathématiques. Il prétend fonder, en dernière analyse 
la mathématique existante par des moyens si sévère- 
ment sélectionnés que leur refus est inadmissible. C'est 
pourquoi Herbrand écrivait encore qu'il cherche seule- 
ment à examiner des théories existantes et étudie les 
caractères des propositions qui y sont vraies; il ne 
prend pas part aux discussions que celles-ci soulèvent; 
il ne cherche pas à les départager. Bref, le formalisme 
apparaît philosophiquement neutre, ce qu'il est incontes- 
tablement dans ses intentions. Faut-il penser que les 
théorèmes de Gôdel (1931), dont résulte l'impossibilité 
de réaliser le programme de Hilbert, montrent en même 
temps l'impossibilité du neutralisme philosophique impli- 
qué par le finitisme conçu comme moyen de sauvegarder, 
en dernier ressort, l'ensemble de la mathématique? 
De simples restrictions finitistes ne semblent pas en 
mesure de démontrer avec précision la légitimité du 
point de vue formaliste, qui s'appuie, en fin de compte, 
sur la croyance qu'aux énoncés intuitifs correspondent 
toujours des énoncés dérivables des axiomes d'un système 
formel. Ainsi était détruite, à sa base, une idée chère à 
Hilbert mais également partagée, quoique sous une autre 
forme, par les logicistes. Ce qui est rendu impossible par 
là, c'est plus qu'une philosophie, c'est l'homogénéité 
philosophique des mathématiques. 

L'intuitionnisme 

Güdel est parvenu à ses résultats en se servant, dans 
son travail, de tout ce qu'alors on pouvait savoir. || a 
abattu les cloisons qui séparaient artificiellement les 
théories mathématiques différentes, en appliquant une 
mathématique intuitive à l'analyse de la mathématique 
formelle, en élargissant l’idée du finitisme, de celle d'arith- 
métique minimale susceptible de battre les intuitionnistes 


sur leur propre terrain à l'aide d'un armement encore 


plus limité que le leur, à celle d'une arithmétique intui- 
tive, c'est-à-dire à la considération du programme intui- 
tionniste. Avec Gôdel, la réflexion formaliste et la réflexion 
intuitionniste, comme les résultats obtenus par l'école 
logiciste, perdent leur statut proprement philosophique 
pour n'être considérées qu'en qualité d'outils. Si cette 
position épistémologique, implicite dans les résultats 
de Gôdel, n'a pas été extrêmement favorable au pro- 
gramme de Hilbert, elle a permis de consacrer l'importance 
de l'intuitionnisme au point de vue classique même, 
dès le moment que ce point de vue quittait le pragma- 
tisme mathématicien pour s'intéresser aux problèmes des 
fondements des mathématiques. 

Qu'est-ce alors que l'intuitionnisme ? C'est une concep- 
tion des mathématiques développée par Brouwer et 
son école (dont les plus illustres sont Beth et Heyting). 
D'accord avec le logicisme, il reproche aux axiomaticiens 
de construire des édifices de rhétorique à la signification 
non assurée, mais contre les logicistes il tend à établir que 
les mathématiques constituent une activité spécifique et 
indépendante de l'esprit, irréductible, en tant que telle, 
à la logique pure. Cette attitude originale aboutit, derrière 
le refus de la théorie des ensembles de Cantor et de Zer- 
melo, à ne rien admettre qui mette en œuvre l'idée de 
totalité infinie actuelle. Anticipant l'idée que l'évidence 
du fini ne permet pas de procurer à l'infini une évidence 
qu'il n'a pas, de par sa nature, elle donne une nouvelle 
portée à l'ancien intuitionnisme; elle donne raison à 
Kronecker contre Cantor et Dedekind et rejette ainsi les 
principaux résultats admis au fondement de l'analyse, 
tels que le théorème de Bolzano-Weierstrass. Bref, il y a 
là de quoi ouvrir la voie à une nouvelle réflexion sur les 
notions d'objet, d'existence et de preuves mathématiques. 

On a eu trop tendance à considérer qu'un objet mathé- 
matique était donné dès le moment où son caractère 
non contradictoire était établi. Pour l'intuitionniste, le 
critère purement logique de non-contradiction ne suffit 
pas. De manière plus générale, il ne suffit pas de la 
compatibilité, dans le sens de la non-contradiction à 
l'intérieur d'une théorie mathématique, pour établir l'exis- 
tence de ses objets. La vérité n’a pas seulement à être 
non contradictoire. En mathématiques, il faut plus; il 
faut une construction, et c'est la possibilité de celle-ci 
qui est décisive. Cela rappelle, certes, une attitude plus 
traditionnelle : Descartes et Kant étaient convaincus de 
l'inadéquation de la logique formelle aux objets mathé- 
matiques, dans la mesure où, pour Descartes, elle ne suffit 
pas à les inventer, et dans la mesure où, pour Kant, la 
mathématique est en elle-même une activité synthétique 
pure, irréductible à la logique, qui est par essence analy- 
tique. Autrement dit, le raisonnement mathématique 
n'est pas seulement l'enchaînement d'inférences for- 
melles : il procède, comme disait Kant, « dans l'intuition 
de l'objet ». Mais le néo-intuitionnisme va plus loin : 
existence signifie constructibilité. Ce qui n'est pas 
constructible est donc rejeté, parce que non intuitif. 
C'est pourquoi l’axiome de choix est rejeté par les intui- 
tionnistes de différentes obédiences, et cela indépendam- 
ment de la question de savoir si cet axiome est compatible 
avec les autres. La compatibilité en soi, ou d'une théorie, 
garantirait aussi peu l'existence que, au point de vue 
intuitionniste, le manque de preuve, l'innocence d'un 
criminel. C'est donc positivement que l'objet mathéma- 
tique est caractérisé, et intrinsèquement qu'il est intuitif. 
Mais l'idée de construction domine toute la production 
intuitionniste; elle vaut également pour le concept de 
déduction : une formule n'est prouvée que si elle résulte 
d'une construction. 

On voit par là que l'intuitionnisme n'est pas hostile à 
la logique, mais il lui assigne le moment précis de son 
intervention : quand il s’agit d'analyser le langage d'une 
théorie mathématique déjà avérée. Cette logique peut 
être formalisée dans le cadre intuitionniste et l'a été 
effectivement par Heyting. 

Par exemple, l'implication A— B y peut être prouvée 
comme une construction transformant toute preuve de A 
en une preuve de B; ou bien, selon Kolmogorov, comme 
le problème qui consiste à réduire le problème de B à 
celui de À, ce qui s'accorde en soi avec la conception 
intuitionniste de l'identité entre un énoncé mathématique 
et sa construction. De même, il y a une idée intuitionniste 
de l'arithmétique des entiers. Tout entier est confondu 
avec sa construction, et la suite n'est supposée donnée 
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qu'en ce sens, et non comme totalité infinie actuelle. La 
suite des entiers joue, aux yeux de Brouwer, un rôle 
fondamental ; elle est à la racine des êtres mathématiques; 
le procédé qui permet de la parcourir dérive d'une intui- 
tion primitive où intervient l'écoulement du temps. Enfin, 
avec les entiers intuitifs à la base, on peut définir des 
types de suites, dont les suites de choix. Celles-ci per- 
mettent de construire un continu qui n'est pas, comme 
celui de l'analyse arithmétisée, composé de points qui 
sont les éléments d'un continu linéaire; il embrasse 
seulement des parties, divisibles sans limite, sans cesser 
d'être continues. C'est un « milieu de libre devenir », sur 
la base duquel il est aussi possible d'élaborer une théorie 
des nombres réels ou une topologie. 

Cependant, s’il y a un aspect par lequel l’intuitionnisme 
est devenu célèbre, c'est la mise en doute des principes 
logiques tels qu'ils étaient enseignés par une tradition 
qui remonte à Aristote. L'intuitionnisme rejette, comme 
on le sait, la validité dans l'infini du tertium non datur ou 
tiers exclu (principe suivant lequel une proposition est 
soit vraie, soit fausse). Une démonstration appuyée 
sur ce principe n'emporterait pas l'adhésion. L'alter- 
native « deux points doivent être distincts ou confondus » 
n'est pas contraignante, car il existe un couple de points 
qui ne sont ni l’un ni l'autre, comme l'illustre le développe- 
ment décimal de 7 où l'on désigne par R le rang décimal 
où commence pour la première fois la suite 1 23456789. 
Si nous définissons un nombre réel tel que 2 — 7 — 10, 
on peut écrire de proche en proche le développement de &. 
En particulier, £ — x est vrai si une démonstration géné- 
rale établit que, dans le développement décimal de =, 
la suite précitée n'apparaît jamais. Bien que o soit uni- 
voquement déterminé, des principes constructifs ne 
permettent pas d'affirmer s’il est ou bien différent de +, ou 
bien égal à x : s'il est différent, c'est qu’on a trouvé le 
nombre k, et s'il est égal, c'est que l'on dispose de la 
démonstration générale mentionnée. Le tiers exclu ne 
s'applique pas. De plus, selon Brouwer, l'application 
sans limite du tiers exclu suppose la résolubilité de tout 
problème mathématique. Le programme de Hilbert 
tient implicitement compte de cette critique dans l'idée 
d'une arithmétique minimale. C'est déjà là un lien entre 
théorie de la démonstration et intuitionnisme. En effet, 
pour les démonstrations de non-contradiction, on pare 
au défaut de puissance des méthodes strictement fini- 
tistes en atténuant le point de vue finitiste par l’adjonction 
de méthodes démonstratives nouvelles. Par exemple, 
on se fie à celles des intuitionnistes pour disposer d'une 
évidence maximale, faute d'une arithmétique minimale; 
c'est la voie indiquée par Herbrand et dans laquelle s’en- 
gage Gentzen dès 1936 pour démontrer la non-contra- 
diction d'une importante partie de l’arithmétique élé- 
mentaire (en utilisant le principe d'induction transfinie 
jusqu'à 60). Larelation étroite entre l’arithmétique classique 
et l'intuitionnisme s'énonce précisément dans le théorème 
de Kolmogorov-Gôdel, qui nous apprend que la non- 
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contradiction de l'arithmétique classique est (logique- 
ment) équivalente à celle de l'arithmétique intuitionniste. 
Dès lors qu'il existe ainsi une interprétation intuitionniste 
d'une théorie classique, celle de l’arithmétique, la voie 
est ouverte à une extension possible (?) de ce fait à 
d'autres théories, et la nécessité posée d'une réflexion 
à poursuivre sur la notion de démonstration. 

Les différentes attitudes à l'égard du problème des 
fondements des mathématiques n'ont donc plus aujour- 
d'hui leur signification d'origine. Si entre logicistes et 
intuitionnistes s'est élevée une querelle de priorité, le 
débat entre formalistes et intuitionnistes s’enracine 
davantage dans le problème des fondements proprement 
dits. L'intuitionnisme a évolué et n'a pas été aussi peu 
fécond qu'on le craignaïit, tandis que le formalisme est 
revenu sur des promesses trop amples, tout en ayant dû 
étendre ses moyens, pour la réalisation du programme 
de Hilbert révisé, au-delà de ce qui était intuitivement 
assuré pour l'intuitionnisme strict. Tout s'est donc passé 
comme si les diverses attitudes n'avaient fait que s'offrir 
les unes aux autres des outils indispensables à la réalisa- 
tion (plus ou moins limitée) de leurs exigences. 


Philosophie et épistémologie 
des mathématiques 


Les conceptions les plus philosophiques des mathé- 
matiques se sont muées en techniques si précises que la 
réflexion philosophique y est devenue sinon impossible, 
du moins trop exigeante pour qu'il soit pratiquement 
possible de concilier la pertinence et l'intelligibilité 
philosophique. Car c'est le philosophe qui est aujourd'hui 
un profane. Dans la mesure où les mathématiques ne 
s'offrent plus comme discours à dépasser vers un dis- 
cours philosophique ultime et fondateur, on peut se 
demander si quelque philosophie peut encore avoir sa 
place au voisinage des mathématiques. 


Problèmes philosophiques 
des mathématiques actuelles 


La première tâche qui s'offre à une telle interrogation, 
c'est de préciser de quelles mathématiques il s'agit. 
La totalité intégrale des mathématiques, construite 
de proche en proche, capable d'éclairer le pur et 
l'appliqué, d'expliquer la nature ultime des êtres et des 
démarches, c'est sans doute un beau rêve, mais il ne 
semble pas avoir grand sens. Qu'en est-il alors de l'unité 
des mathématiques ? 

Longtemps, les mathématiques ont vécu sur une dis- 
tinction bien nette entre le discret et le continu, séparés 
par un fossé qu'on n'a comblé jusqu'ici que pour le 
creuser davantage. Depuis Descartes, on n'a cessé de 
jeter les ponts entre les deux domaines. D'abord un 
parallélisme de structure entre la géométrie et l'algèbre, 
qui s'est de plus en plus précisé. Ensuite, le développe- 
ment de l'analyse, c'est-à-dire le « saut » dans des consi- 
dérations où le concept d'infini joue un rôle. Enfin, 
l'arithmétisation de l'analyse, c'est-à-dire l'élaboration 
purement arithmétique du contenu linéaire, qui a permis 
à Hilbert de réduire la géométrie elle-même, ou plutôt 
les types de géométrie à l'arithmétique des réels. Le tour 
de force admiré consacre l'unité de la grandeur et du 
nombre, indique que ce qui s'applique au calcul des 
nombres réels s'applique également au calcul avec des 
segments de droite. Or, c'est la méthode axiomatique qui 
a procuré ces résultats. 

Cette méthode est féconde par elle-même, mais aussi 
par les problèmes qu'elle pose. Elle conduit aux idées 
de formalisation et de système formel. Mais elle permet 
aussi d'élucider et d'expliciter la nature de types abstraits 
de structure, de poser les problèmes au plus haut degré 
de généralité et de précision, de montrer l'intérêt de 
l'appareil du langage et de la logique, la nécessité de 
distinguer le système et ses interprétations, puisque 
l'étude d'un système formel induit celle d'une méta- 
théorie qui, si elle est précise, doit avoir les moyens de 
nommer sans confusion les termes et les formules du 
système qu'elle étudie. 

Mais cette unité méthodologiquement assurée par 
l'axiomatisation n'est pas aussi entière au niveau le plus 
profond, c'est-à-dire de la fondation justifiée du continu, 
où intervient l'infini, sur le discontinu qui peut être infini 
potentiel, mais qu'il n'y a aucune nécessité à considérer 
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comme ensemble achevé : ne suffit-il pas de dire, comme 
Poincaré, que « quand je parle de tous les nombres 
entiers, je veux dire : tous les nombres entiers qu'on a 
inventés, et tous ceux que l'on pourra inventer un jour. 
et c'est ce « que l’on pourra » qui est l'infini »? On a vu 
qu'il n’est pas possible de joindre l'infini à partir de fini- 
tismes stricts. Suffit-il d’adjoindre aux moyens intuitive- 
ment assurés, qui ne reposent pas sur l'infini actuel, des 
énoncés axiomatiques tels que ceux de l'infini ou du 
choix par simple droit et autorité de législation axio- 
matique? Est-ce une raison suffisante pour justifier 
cela que d’alléguer, ce qui est le recours constant du 
« working mathematician », qu'il nous faut produire des 
fondations susceptibles de reproduire l'acquis classique, 
dont personne ne met en doute la signification pour la 
mathématique aussi bien appliquée que pure? Est-ce là 
le signe du caractère arbitraire des choix classiques, qui 
ne justifieraient alors que des développements liés à leur 
tour aux développements et aux exigences de domaines 
étrangers à la mathématique ? Non, sans doute. Car il sem- 
ble précisément que les parties les moins liées aux 
domaines étrangers sont celles qui ont un caractère « spé- 
culatif », et qui sont le fruit de l'imagination logique. Cela 
empêche pour le moins tout jugement précipité, toute 
philosophie arrêtée des mathématiques qui mobilisent 
chaque fois à nouveau une réflexion philosophique. Car 
une chose est certaine : c'est que les mathématiques sont 
en perpétuelle interrogation sur leur organisation, les 
rapports entre leurs différentes parties, leurs différents 
résultats, les meilleures manières de les agencer. Elles 
sont toujours en réorganisation. Mais elles ne cessent pas 
de se poser des problèmes au sujet de leur validité. C'est 
pourquoi les théories de la démonstration ne tendent pas 
à donner une réponse définitive à un problème définiti- 
vement formulable, mais suivent le mouvement de cette 
liberté créatrice, même si sa création n'est point l'écoule- 
ment continu et sans heurts des propositions et des théo- 
rèmes. Les mathématiques alors ne prouvent pas, pour 
reprendre ici une expression bien connue, le mouvement 
en marchant, mais elles produisent les principes de leur 
propre mouvement. Qu'est-ce à dire sinon qu'il est impru- 
dent, non seulement de philosopher sur les mathématiques 
à partir d’une philosophie atrophiée, mais aussi de croire 
qu'il n‘y a pas de rapport entre philosophie mathématique 
et mathématique, puisque cette croyance fut celle du pro- 
gramme de Hilbert, lequel a été, précisément, c'est-à-dire 
mathématiquement, réfuté ? 


Épistémologie et histoire des mathématiques 


S'il existe donc une réflexion philosophique, techni- 
quement armée, capable de maintenir dans son interro- 
gation l'exigence de sonder la validité mathématique 
dans une théorie de la preuve, inachevée et prometteuse, 
susceptible de réaliser des progrès suffisamment signi- 
ficatifs pour avoir des répercussions sur le cadre logique 
usuel, dont elle révèle l'extrême simplicité par rapport 


aux constructions multiples qu'on peut y réaliser, cette 
réflexion se maintient et se cultive au sein de cette mathé- 
matique supérieure qui s'occupe (encore et toujours) 
[cf., par exemple, maints articles de G. Kreysel] des fon- 
dements. Le philosophe, c'est le mathématicien que la 
mathématique suscite pour débloquer une probléma- 
tique, dépasser une situation figée par des attitudes 
d'école, dégeler un point de vue ancré dans la technique. 
Le philosophe, c'est le mathématicien soucieux de la 
signification des démarches qu'il effectue, qu'il engage 
sur la base d'une analyse du matériau auquel il donne une 
nouvelle perspective, ou qu'il gagne à une nouvelle 
fonction. Un travail de pensée gît souvent sous l'écorce 
conceptuelle. Et c'est du travail de philosophe, au sens 
propre, que sa mise en chantier en vue de sa restitution, 
non pas en tant qu'activité mentale inaccessible, mais en 
tant que téléologie intellectuelle dont on doit expliciter 
la démarche et les moyens dans une configuration concep- 
tuelle donnée. Parfois ce travail est déjà indiqué par le 
mathématicien : posant qu'il existe deux théories des 
ensembles, l'une qui admet l’axiome de constructibilité, 
l'autre qui le rejette. Quand on admet la constructibilité, 
on admet, évidemment, un certain nombre de consé- 
quences et de propriétés qui en résultent, dont le fait 
que l’axiome est compatible avec les autres axiomes de 
la théorie. Cette consistance relative en établit la vérité 
dans le domaine des ensembles constructibles. D'où 
la nécessité d'une analyse de la notion de constructibilité. 
Mais cette analyse n’est pas conduite conceptuellement. 
Le concept se déploie dans la technique. Car c'est un tra- 
vail nécessairement technique, lui-même impossible 
sans analyse conceptuelle, sans élucidation de la notion 
de constructibilité dans ce contexte. C'est-à-dire que les 
techniques mathématiques ne se réduisent plus toutes à 
des problèmes qu'on peut confier à des sous-traitants. 
Elles fournissent les conditions minimales de la rationalité 
mathématique. 

C'est précisément ce qui justifie l'analyse épistémolo- 
gique de moments mathématiques privilégiés, qu'on 
poursuit en France, depuis les analyses par trop philoso- 
phiques d'A. Comte jusqu'aux exigences plus raffinées de 
Bachelard, de Cavaillès et de Desanti. Leur justification 
est exprimée par L. Brunschvicg, qui pensait que c'est 
le développement de la mathématique « qui nous instruit 
des fonctions de l'intelligence », ce qui demeure vrai si 
l'on prend soin de briser les cadres factices des facultés, 
de briser même ce sur quoi L. Brunschvicg bâtissait : le 
cadre factice de « l'intelligence occidentale », de l'idée 
ambiguë de développement, de l'illusion d'une critique 
philosophique extérieure. Mais l'idée d'un chemin qui 
n'est ni l'étude de l'activité mentale mathématicienne, ni 
la réflexion outillée sur l'idée de construction, de preuve, 
voire de déduction, et qui permet une caractérisation 
intrinsèque du « réel » mathématique, ne peut être inter- 
dite. 

A une condition cependant, qui doit être effectivement 
remplie : que l'épistémologue participe à la fois « du 
mouvement de l'intelligence et de la rigueur logique ». 
Qu'il y participe : c'est-à-dire qu'il s'interdise de fixer 
des notions mobiles ou de mobiliser des notions inertes. 
Qu'il saisisse que la logique mathématique elle-même 
est un des mouvements de l'intelligence. 

Ce mouvement de |’ « intelligence » a été caractérisé 
par Cavaillès comme un mouvement « dialectique ». 
Cela s'entend d’abord négativement : car ni l'expérience 
au sens physique, ni aucun a priori logique ne saurait 
fonder les mathématiques. Ni non plus, à vrai dire, aucune 
genèse empirique, car « l'enfant devant son boulier est 
mathématicien, et tout ce qu'il y peut faire est mathé- 
matique ». La mathématique est dès son «commencement » 
mathématique à part entière. Mais son devenir effectif 
reflète une structuration où l'on distingue des aspects 
paradigmatiques et des constructions thématiques. Une 
construction paradigmatique est, par exemple, le mou- 
vement formel, « le moment de la variable » où, « en 
remplaçant les déterminations d'actes par la place vide 
pour une substitution, on s'élève progressivement à un 
degré d'abstraction qui donne l'illusion d'un formel 
irréductible ». Tel serait le moment hilbertien pris dans son 
mode de réflexion sur les systèmes formels et leurs inter- 
prétations. Toutefois, « la formalisation n'est réalisée 
que lorsque au dessin des structures se superposent, 
systématisées, les règles les régissant. La thématisation 
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prend son départ dans l'enchaînement saisi cette fois 
dans son vol, trajectoire qui se mue en sens » (Sur Ja 
logique et la théorie de la science, pp. 29-30). Style 
second qui est le moment métamathématique où le 
thème principal est la fondation du mouvement démons- 
tratif lui-même. 

C'est dans cette voie que s'est engagé J. T. Desanti, 
convaincu qu'une épistémologie des mathématiques 
doit rompre toute attache avec les discours philosophiques 
en « s'installant dans le contenu des énoncés scienti- 
fiques. Pour les mathématiques comme pour les autres 
sciences, il faut « ou se taire … ou bien en parler de l'inté- 
rieur, c'est-à-dire en les pratiquant » (Philosophie silen- 
cieuse, Seuil, 1969, p. 108). Mais il y a des problèmes 
épistémologiques, c'est-à-dire des systèmes d'expressions 
appartenant à un domaine théorique donné et qui exigent, 
à un moment du développement de cette théorie, une 
attention particulière, la mise en chantier d'une réflexion 
indispensable, soit pour lever un obstacle à l'intelligibi- 
lité de la théorie, soit pour parvenir à une intelligibilité 
supérieure. Ainsi, la théorie naïve des ensembles a-t-elle 
entre 1900 et 1908 posé un certain nombre de problèmes : 

— exigence d'une démonstration de la proposition 
« Tout ensemble peut être bien ordonné »; 

— exigence de restrictions sur le concept d'en- 
semble pour éviter les paradoxes; 

— exigence enfin de déterminer le statut de l'axiome 
de choix, indispensable à la démonstration du théorème 
de bon ordre. 

Or, si la première et la troisième exigences ont un 
caractère régional, la seconde implique le programme 
d'une axiomatisation au sens abstrait qui doit être la 
reproduction de l'édifice ensembliste tout entier muni de 
garanties anti-contradictoires, c'est-à-dire, en fait, l'éla- 
boration d'un langage rigoureusement construit. Nous 
avons déjà remarqué plus haut que Desanti s'est attaché 
à l'analyse du mouvement complexe d'axiomatisation 
dans les /déalités mathématiques. Mais on peut envisager 
une épistémologie qui, au-delà des raffinements intrin- 
sèques, s'intéresserait aux variétés stylistiques de la 
construction mathématique, qui tâcherait d'intégrer 
l'individuel, le processus concret du travail dans l’« œuvre » 
mathématicienne. 

Ainsi, comme le remarque G. G. Granger (Essai d'une 
philosophie du style, À. Colin, 1968, p. 20), on peut 
introduire la notion de nombre complexe de plusieurs 
manières sans modifier les propriétés opératoires carac- 
térisant la structure algébrique du « corps des complexes ». 
La représentation trigonométrique fait intervenir un 
angle, l'argument, et un nombre réel, le module. Le mathé- 
maticien danois du XVIIIe siècle Wessel l'a proposé dans 
l'intention d'établir un calcul qui porte à la fois sur les 
grandeurs et les « directions ». L'être mathématique ainsi 
constitué peut être envisagé de deux manières : soit comme 
élément statique, où vecteur, soit comme un opérateur 
appliqué à des vecteurs. Le premier cas suggère un passage 
naturel des coordonnées polaires aux coordonnées 
cartésiennes. Mais le second suggère, grâce à l'apport 
intuitif de l'image géométrique, une construction immé- 
diate des lois de la multiplication des nombres complexes. 
Toutefois, d'autres concepts sont possibles du « corps » 
des complexes : soit comme matrice carrée régulière 
d'un certain type, soit plus abstraitement comme corps 
d'extension des réels. Ces différentes façons constituent 
des faits de style. Ces faits peuvent être à l'origine de 
véritables variations conceptuelles et peuvent déterminer 
l'orientation d’un concept. Le « style » révèle donc un 
aspect du travail mathématique, « une dialectique de son 
développement interne » qui vient enrichir l'épistémologie 
de nouvelles nuances, de nouveaux aperçus sur ce travail. 

Mais ce type d'épistémologie, aussi proche qu'il soit 
du travail mathématique, comme le souhaite Desanti, 
reçoit la mathématique constituée. Ce savoir accompli, 
le philosophe n'a donc pas à l'énoncer. Mais seulement 
à détruire le discours aveugle et second qui l'accompagne, 
à déchiffrer, au plus près de l’activité mathématique, ce 
qui enchaîne et éclaire les motivations qui lui sont propres. 
Il ne peut donc, à partir de là, ériger quelque nouveau 
système philosophique, mais seulement expliciter la phi- 
losophie que ce savoir véhicule, et le considérer moins 
pour en tirer une leçon philosophique que pour en saisir 
l'effectivité, fût-ce au point limite qu'est l'état momentané 
d'un savoir. 
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LE LANGAGE 
ENSEMBLISTE 


Nous étudierons le langage ensembliste en nous 
appuyant le plus possible sur des notions intuitives. Cette 
facon de procéder permet d'acquérir très rapidement 
ce langage, indispensable pour progresser en mathé- 
matiques. 

Par contre, elle présente des dangers : les notions intui- 
tives, courantes, « naïves », sont trop imprécises. Ce 
sera l'objet du chapitre suivant traitant de la théorie 
des ensembles que de redéfinir plus rigoureusement cer- 
taines notions, de montrer sur quels choix elles reposent. 

De toute facon, en mathématiques, il ne s'agit pas 
tant d'approfondir des notions « en soi » que d'étudier 
les rapports entre les divers êtres mathématiques. L'étude 
des relations existant entre plusieurs notions éclaire 
davantage chacune d'elles que leur étude #solée où leur 
approfondissement à perte de vue. 


Ensembles et éléments 


Le mot ensemble est le mot le plus « neutre » que l'on 
puisse utiliser pour désigner un groupement imaginaire 
d'objets; mais il ne suffit pas d'imaginer un ensemble 
pour qu'il existe. Pourtant, dans un premier temps, 
nous nous en contenterons en nous limitant à des ensem- 
bles définis de façon indiscutable. 

Ainsi : {0, 2, 4, 6, 8} est un ensemble (l'ensemble des 
5 premiers nombres pairs). De même : {x, y, z} est l’en- 
semble de 3 objets x, y, z. Tout objet qui « fait partie » 
de l'ensemble considéré est appelé « élément de l’en- 
semble »; « x est élément de l'ensemble E » pourra 
s'écrire également : «xe E », qui se lit & x appartient 
à E » (E désigne à la fois l'ensemble et le nom de cet 
ensemble). Ainsi, si E — {0, 2, 4, 6, 8}, on peut écrire : 
4eEetO0ÆE. Par contre, 7 n'appartient pas à l'ensem- 
ble E : on notera 7 € E, qui se lit « 7 n'appartient pas à E ». 
La notion d'appartenance n'est pas une notion de pro- 
priété : un même élément peut appartenir à plusieurs 
ensembles. Il n'y a pas de propriété privée en mathé- 
matiques |! 

On remarquera que, très souvent (mais pas toujours), 
les ensembles sont désignés par des lettres majuscules 
(E, À, B, …) alors que les éléments sont désignés par 
des lettres minuscules (a, b, x, y, …). Ceci se complique 
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du fait qu’un ensemble est un objet mathématique 
comme les autres; il peut donc être considéré comme 
élément d’un autre ensemble. Par exemple, une droite D 
est un ensemble de points; mais cette même droite 
est un élément de l’ensemble des droites d'un plan conte- 
nant D. 

Les accolades sont réservées aux ensembles; elles 
entourent les éléments d'un ensemble. On distinguera par 
conséquent l'élément a (ou l'objet a) de l'ensemble à 
un seul élément {a}, appelé singleton; un ensemble à 
2 éléments {a, b} est une paire, ou doubleton. 
Définition (construction) d’un ensemble 

Un ensemble peut être défini de deux façons : 

— par une description superficielle, mais complète, 
exhaustive, en citant tous ses éléments; c'est la défini- 
tion en extension. 

Exemple : E — {0, 2, 4, 6, 8} est défini en extension, 
puisque l'on a cité tous ses éléments : 0, 2, 4, 6,8. 

Un objet qui n'est pas sur cette « liste » n'appartient 
pas à l'ensemble : 15ÉE, par exemple. Chaque élément 
de l'ensemble ne doit être écrit qu'une fois; si un même 
élément se retrouve écrit deux fois, il faut en supprimer 
une : {3, 7, 4, 7} = {3, 7, 4}; par contre, l'ordre n'a pas 
d'importance : {3, 7, 4} = {3, 4,7} — {7, 4, 3}; = … 

— par une description qui permette de comprendre 
quels sont les éléments qui appartiennent ou qui n'ap- 
partiennent pas à l’ensemble, sans les citer tous. C'est la 
définition en compréhension, par une propriété caracté- 
ristique des éléments de l'ensemble que l'on veut définir, 
c'est-à-dire par une propriété : 

e que tous les éléments de l'ensemble ont; 
e qu'ils sont les seuls à avoir. 

Il est cependant nécessaire de « puiser » les éléments 
du nouvel ensemble dans un ensemble plus vaste (le 
référentiel), afin d'être sûr de définir un nouvel ensemble. 

Exemple : si N désigne l'ensemble des entiers 
naturels (N = {0, 1, 2, 3, …}), nous pouvons définir 
l'ensemble E des nombres entiers naturels qui sont pairs 
et strictement inférieurs à 10 en écrivant : 


E—{xenN | xest pair et x < 10}. 


Les accolades indiquent qu'il s’agit d'un ensemble; 
«x e N » indique que les éléments de E sont des éléments 
de N, c'est-à-dire des entiers naturels; la barre se lit 
« tels que » et « x est pair et x < 10 » est la propriété 
caractéristique des éléments de E. On lira donc : « E est 
égal à l'ensemble des x appartenant à N tels que x est pair 
et x est strictement inférieur à 10 ». Les entiers qui véri- 
fient ces conditions sont : 0, 2, 4, 6,8, 


donc E = {0, 2, 4, 6, 8}. 


Autre exemple : avec R — ensemble des nombres 
réels. 


E={xerR |sinx= 1} 


= (+2) (C+ar)…(5+24x).) 
= 6: 27|, 57 su 5” 2kr “| 

Nous insisterons enfin sur le fait qu'un ensemble n'est 
bien défini que lorsque l’on peut répondre par oui ou 
par non, de façon indiscutable, et pour tout objet, à la 
question : « Cet objet est-il élément de E? » 

Ainsi, dans l'exemple précédent: 15ÉE, réE, _ € E, 
la tour Eiffel é E. 

Par contre, |’ « ensemble des grands champions auto- 
mobiles », ou l’ « ensemble des personnes à cheveux 
bruns » ne sont pas définis ; ce ne sont pas des ensembles : 
les propriétés sont trop vagues, et se prêtent à des inter- 
prétations différentes pour un même individu. 
Ensembles finis ou infinis 

Un ensemble peut être fini ou infini : 


{0, 2, 4, 6, 8} est fini. 
L'ensemble des nombres entiers pairs : 
P = {0, 2, 4, 6, 8, 10, 12, ...} est infini. 


Ensemble vide 
Un ensemble qui n'a pas d'éléments est un ensemble 
Vide; on le note & ou { }. Par exemple : 


F=fxeN]x>7 et x<5}= 2 


car aucun entier naturel n’est à la fois strictement supé- 
rieur à 7 et strictement inférieur à 5. 
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= ensemble des nombres entiers naturels 
101,2 Su) 


ensemble des nombres entiers relatifs 
=, —8,-2,-1,0,1,2,3,...} 


= ensemble des nombres décimaux, c'est-à-dire des nom- 
bres dont le développement décimal illimité ne contient 
que des zéros à partir d’un certain rang. 
exemple : 7,25 = 7,250 00 … 
12 = 12,000 O … 


Ils peuvent toujours se mettre sous la forme X_, x étant 
un entier relatif. 10" 


= ensemble des nombres rationnels, c’est-à-dire des nom- 
bres x tels qu’il existe 2 entiers relatifs p et q vérifiant 
x= P. 

q 
est aussi l’ensemble des nombres dont le développe- 

ment décimal illimité est périodique c’est-à-dire que le 
même «groupe de chiffres» se répète indéfiniment : 
ii DR TEA | 


F3 = 1,571 428 571 428 5 … _ = 4,333 3 … 


La périodicité n'apparaît quelquefois qu’à la 30° décimale 
ou plus tard encore. 


ensemble des nombres réels 

ensemble des nombres rationnels et irrationnels 
ensemble des nombres dont le développement décimal 
illimité est périodique ou apériodique (sans période) 
nombres irrationnels : nombres dont le développement décimal illimité est 
apériodique. 

V2 =1,4142138.. 


Lué = 3,141 59 … 
sont des nombres irrationnels. 


1 = ensemble des nombres complexes 


nombres complexes : nombres de la forme a + ib, où a et b sont deux réels 
et iun nombre «imaginaire pur» tel que i? = -1 


NeZcDcOHOcRceC 


: relation d’appartenance entre un élément x 
et un ensemble E 
xÆ. E se lit «x appartient à E» 
x É E se lit «x n’appartient pas à E» 


E ue à 
x 
XEE XÉE 


: relation d’inclusion entre deux ensembles 
ou entre deux parties 
A C Bselit «A est inclus dans B» 
A Œ B se lit «A n’est pas inclus dans B» 
B A se lit «B contient A» 


C2 
AC 8 @: 
B35A Ag£B 


: relation d'égalité entre deux objets 
de même nature : 
A=Bæ>AetB ne sont qu'un 


seul et même objet 
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À Les deux triangles 
ABC et A'B'C' 

se « ressemblent 
beaucoup »; 

ils sont même 

« superposables ». 
Mais ils ne sont 

pas égaux pour autant, 
car ils sont distincts. 


 Ci-contre, 

de haut en bas, 
représentations 
schématiques, à l'aide 

de diagrammes de Venn, 
du complémentaire 

d’un sous-ensemble; 

de l'intersection 

de deux ensembles ; 

de deux ensembles disjoints. 


Rien ne distingue un ensemble vide d'un autre ensemble 
vide ; il n'y a donc qu'un ensemble vide (en fait, on pose 
l'existence d'un tel ensemble) ; et quel que soit l'objet x, 
xÉ S. 

Égalité 

La notion « moderne » d'égalité exclut la possibilité 
que deux objets distincts soient égaux. C'est en fait 
l'identité. Deux objets ne sont égaux que s'il s’agit d'un 
seul et même objet; (3 — 2) et (4 — 1) désignent en 
fait le même objet, le nombre 5; la relation d'égalité : 
3—+—2—4—+1 est donc vérifiée. Par contre, deux 
triangles distincts ABC et A’B’C’ (avec A différent de A’ 
par exemple) ne peuvent être égaux, puisque distincts. 
C'est ce qui explique la disparition des défunts « cas 
d'égalité des triangles » des manuels scolaires récents; 
de même, on parlera d'aires égales et non de surfaces 
égales pour deux figures distinctes (l'aire étant la mesure 
de la surface), etc. 

Ensembles égaux 

Deux ensembles ne seront égaux que s'ils ont exac- 
tement les mêmes éléments, autrement dit que s'il ne 
s'agit que d'un seul et même ensemble. 

Exemple : 


K = M, 15 16, 17 
L—fxenN | xestimpair, x > 10 et x < 20} 


L a pour éléments : 11, 13, 15, 17, 19 

donc K = L. 
Inclusion 

Si l'on considère seulement certains éléments d'un 
ensemble, on considère une partie de cet ensemble; on 
dit encore un sous-ensemble de cet ensemble. 

Exemple : À = {0, 4, 8} est un sous-ensemble ou 
une partie de E = {0, 2, 4, 6, 8} puisque À est constitué 
uniquement d'éléments de E. On note: AG E:« A est 
INCLUS dans E ». L'inclusion est une relation entre 
deux ensembles où sous-ensembles. 

Par définition : 


ACE<I[xEeA = xEE] 


Le signe <+ se lit et signifie « équivalent à ». 

Le signe = se lit et signifie « implique » ou « entraîne ». 

Si À est inclus dans E, tout élément de A est élément 
de E, et réciproquement, si tout élément de A est élément 
de E, alors A est inclus dans E. Il revient au même d'écrire 
A © B (A est inclus dans B) ou B = A (B contient A). 

x Tout ensemble est inclus dans lui-même. Pour tout 
ensemble E, E & E; E est la partie pleine de E. 

X L'ensemble vide Z est inclus dans tout ensemble : 
pour tout ensemble E, Z & E; g est la partie vide de E. 
(On peut en effet toujours affirmer que les éléments 
de Z sont aussi éléments de E; personne ne pourra 
montrer un élément de Z qui n'appartient pas à E, 
puisque Z n’a pas d'éléments!) 

X Toute partie de E qui n'est ni vide ni pleine est une 
partie propre de E. 

x Il existe un ensemble formé de toutes les parties 
de E, noté Ÿ (E). 

Exemple : À = {x, y, 2}. 


T (A) = {S, {x}, {y}, {2}, {x, y}, {y Zz} {z, x}, {x, 2 z}} 


Il y a donc 6 parties propres de A et 23 = 8 parties de À 
au total. 


: intersection (de deux ensembles ou parties) 


AN B se lit : «A inter B» 


ANnB 


: union ou réunion (de deux ensembles ou parties) 
AU B se lit «A union B» 


intersection de toutes les parties À ; dont l’indice ji 
appartient à Ï (ensemble d'indices) 
Sil= { 1,2, 3, … 


AUB 


n} 


A A=AfNazfas.. Na 


union de toutes les parties À; telles que ieI 
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Complémentaire d’un sous-ensemble 

Soit E un ensemble, et À une partie de E. Les éléments 
de E qui ne sont pas éléments de A forment un ensemble, 
le complémentaire de À par rapport à E, noté Cia ou 
(E — A) ou encore A. 


CrA ={xeE|xéA) et: 
xE CA & XEE et xéA 
Exemple : 
: E = {0,1,2,3,4,5,6,7} 
P = {0, 2, 4,6} 
CeP = {1,3,5,7 
en particulier : 
Cre = E Ce = g Cr (CxA) =AÀ 
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« Opérations » sur les ensembles 


Nous grouperons ici toutes les « opérations » qui asso- 
cient à deux ensembles un troisième ensemble, 
Intersection de deux ensembles 

Soit À et B deux sous-ensembles d'un ensemble E: 
l'ensemble des éléments communs à A et à B, c'est-à-dire 
l'ensemble des éléments qui appartiennent à la fois à A 
et à B, est l'intersection de A et de B, notée « À NB » 
et lue « A inter B »: 


ANB={xEeE|xEA et xeB} 
ou encore : 
xEANB<&XxEA et xeB 


Exemple 

A = {0, 3, 6, 9, 12, 15, 18, 21, 24, 27, 30} 
B = {0, 5, 10, 15, 20, 25, 30, 35, 40} 
ANB=({0,15, 30} 
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L'intersection de deux ensembles peut être vide, mais 
elle existe toujours : 


Exemple : 
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Les ensembles sont alors DISJOINTS. 
Remarquons que, si À & B, alors A MN B = A. 


Exemple : | = {0, 1,2, 8, 4,5} 
J = {0, 1, 2, 3, 4,5, 6, 7, 8} 
IcJ—=INAJ=I1—-${0,1,2,3,4,5} 
et réciproquement: 1NAJ=lælce y. 


Enfin, & NA A= S pour tout ensemble A. 
Réunion de deux ensembles ‘ 
Soit deux sous-ensembles À et B de E; l'ensemble de 
tous les éléments de À et de B, c'est-à-dire l'ensemble 
des éléments qui appartiennent soit à À, soit à B, soit aux 
deux à la fois, s'appelle la réunion des ensembles A et B : 


AUB={xEeE|xEeA ou xeB} 
ou: 
xXEAUB<xEeA ou xEeB 


On remarquera que le « ou » utilisé ici est un « ou » in- 
clusif, c'est-à-dire qu'il inclut la possibilité d'avoir les deux 
assertions à la fois; par conséquent, les éléments de 
l'intersection sont aussi dans la réunion : 


ANB<AGAUB 
ANBS<B<GAUB 


Remarquons que À |J A = À et A) 3 = À pour 
tout ensemble À ; enfin, que, si A € B, alors AUB=B 
et réciproquement: AUB=B—= AC BE. 

Exemple : avec l'ensemble précédent (pris pour 
l'intersection) : 


A U B = {0, 3, 6,9 12,15, 18, 21, 
24, 27, 30, 5, 10, 20, 25, 35, 40} 
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C = D 


Différence symétrique de deux ensembles 

Soit À et B deux sous-ensembles de E. La différence 
symétrique de A et de B est l'ensemble des éléments qui 
appartiennent soit à À seulement, soit à B seulement: 
on la note « À À B », qui se lit : « A delta B » 


AAB—{xEeE | (xEeAetxéB) ou (xéAetxeB)} 
={xeE|xEeAUB et xéANB} 


Plus simplement : A À B — Gatis (A N B) 
= (AU B) — (A NB). 
Exemple : avec le même exemple que pour l'inter- 
section et la réunion: 
A AB — {3, 6,9, 12, 18, 21, 24, 27, 
5, 10, 20, 25, 35, 40} 
(on retire de A |J B tous les éléments de À N B). 


Les propriétés de la réunion et de l'intersection seront 
étudiées dans le chapitre suivant. 
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: différence symétrique de 2 ensembles 
A À B se lit : «A delta B» 
AB=AUB-AfE 


: complémentaire de A dans E 


produit cartésien de l’ensemble A = a b. c} 

A par l’ensemble B. y} 

Se lit : «A croix B» ARE (aol, x)(ex)(a,y)(&e 4)(c,4)} 
A:={a, bc} cat A = 2 


cañd À : se lit : «Cardinal de A» 


Relations binaires 


AxXB : 


Couples 

Considérons une paire {x,y}; nous savons que 
{x, y} = {y, x}: autrement dit, |" « ordre » dans lequel 
sont rangés x et y n'a pas d'importance. Un couple sera, 
au contraire, un ensemble de deux éléments sur lequel 
a été défini un « ordre ». 

Dans le couple (x, y), noté avec des parenthèses, 
« x est avant y », ou « x est la première projection (ou 
composante), y est la seconde projection (ou compo- 
sante) ». Par conséquent, les couples (x, y) et (y, x) 
ne sont pas égaux. 

Deux couples (x, y) et (x’, y’) sont égaux si, et seule- 
ment si, leurs premières projections sont égales entre elles 
et leurs secondes projections sont égales : 


Xy)= (X;y)æx=x'ety = y 
Exemples : 


(2+ 4,10) = (6,2 x 5) 
(15, 150) = (5 x 3, 5 x 30) 


En fait, n'ayant pas vraiment défini ce qu'était un 
« ordre », la définition d’un couple repose sur une dis- 
tinction formelle entre le premier et le second élément 
du couple, ainsi que nous le verrons au chapitre suivant. 
Produit cartésien de deux ensembles 

Soit E et F deux ensembles, et soit Ex F (qui se lit 
« E croix F ») l'ensemble de tous les couples (x, y) tels 
que x est élément de E et y est élément de F: 


EXF={(xXy)IxEeE et yeF} 


E x Fest le produit cartésien de E par F. 

Comme les couples (x, y) et (y, x) sont différents, 
les produits cartésiens E XF et FX E ne sont pas égaux. 
Il suffit d'inverser les couples de Ex F pour obtenir 
FE. 

On remarquera au passage que l’on n’a pas précisé 
d'ensemble de référence pour les couples (x, y) dans la 
définition de E xF; c’est que l’on définit en fait le produit 
cartésien à partir de la définition rigoureuse d'un couple 
(cf. chapitre suivant). 


<« Représentation 
schématique, à l'aide 
d'un diagramme de Venn, 
de la réunion 

de deux ensembles. 


Exemples : 
— Soit E = {1,3,5} 
F = {0, 47} « Un autre exemple 
ExF=— {(1,0), (1,47), (3,0), (3,47), (5,0), (5,47)} de la réunion 
FxE—£{(0,1), (0,3), (0,5), (47,1), (47,3), (47,5)} de deux ensembles. 


« Diagramme de Venn 
du produit cartésien 
de deux ensembles. 


= 
© 
O 
so 

D 

Li 
< 
9 
ca 
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ŸY Plan muni 

du système de coordonnées 
défini par R. Descartes 
(1596-1650), 

et à l’origine du terme 
produit cartésien. 


> Ci-contre, en haut, 
diagramme sagittal 

d'une relation : 

chaque flèche 

a pour point de départ 
un élément de l’ensemble 
de départ E et pour 

point d'arrivée un élément 
de l’ensemble d'arrivée F. 
£n bas, le tableau cartésien 
représentant le graphe 

de la relation ci-dessus. 


— Soit un plan euclidien P muni d'un système 
d'axes de coordonnées cartésiennes. À chaque point M 
du plan sont alors associés deux nombres réels, son 
abscisse x et son ordonnée y, donc un couple (x, y), 
et réciproquement, à chaque couple (x, y) de deux 
nombres réels, est associé un point et un seul du plan. 

On pourra identifier tout point M du plan P avec le 
couple (x, y) de ses coordonnées etraisonner dans RxR, 
produit cartésien de R par R (R = ensemble des nombres 
réels), au lieu de raisonner dans le plan muni du système 
de coordonnées défini par René Descartes (1596-1650): 
c'est là l'origine du terme produit cartésien. 


On note E? le produit cartésien de E par lui-même, 
et plus généralement, E* le produit cartésien de n fois 
l'ensemble E. 


Exemple : R? = RXxR:R1=RxRxXRXR 
n fois 


Un élément de R4 est un quadruplet : 
avec ER, ER, xeRetxueR 

Un élément de R? est un « n-uplet » : 
avec x1E€ R, …, x ER. 

Diagonale de E? 

Soit E un ensemble, et Ex E — E? le produit cartésien 
de E par lui-même. La diagonale de E? est l'ensemble de 
tous les couples (x, x) avec xE€ E. On la note souvent 
À (delta) ou Ag: 


AE = {(XyY)EeExXE|x= y} 


(Naturellement cette partie de Ex ÆE ne peut être définie 
dans un produit Ex F avec F  E.) 
Graphe d'une relation 

Soit E et F deux ensembles, et Ex F le produit cartésien 
de E par F. Une relation binaire de E vers F, c'est au fond 
l'ensemble des « liens » qui existent entre un élément 
de E et un élément de F (d'où le nom de binaire, puis- 
qu'elle met en cause deux éléments à la fois) ; elle est 
donc définie par un ensemble de couples (x, y), tels 
que x est lié à y, avec x€eE et yeF, c'est-à-dire par 
une partie de ExF. Cette partie du produit cartésien 
E xF est le graphe de la relation. 

Réciproquement, toute partie de E x F définit une 
relation binaire de E vers F (puisqu'elle définit un 
ensemble de couples (x, y), donc des « liens »). 

E est l'ensemble de départ et F est l'ensemble d'arrivée 
(puisque l'on va de E vers F). 

Les relations binaires sont souvent désignées par des 
majuscules anglaises R, $, GC ou par des symboles 
(qui désignent souvent une « loi de composition interne »): 
T,L,%x%, A, etc. (Tse lit souvent «truc» et | «anti-truc»). 

Si, par exemple, G est le graphe de la relation R de 
E vers F, pour exprimer que x (élément de E) est lié 
par R à y (élément de F), on peut écrire : 


CR (x, y)» 


(X1, X2, X3, X4) 


(X1, X2, , Xn) 


«(x y)eG>» où «xR y» ou 
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Si x n'est pas lié par SR à y, on écrira : (x, y) é G 
ou « x non R y » ou « non R (x, y) ». 

Une relation entre deux objets est une affirmation, 
une assertion, qui peut être ou ne pas-être vérifiée. On 
admettra que, si une relation entre deux objets X et Y 
n'est pas vérifiée, son « contraire » est vérifié. 

Par exemple : 


siae E n'est pas vrai, a  E est vrai 
si À € B n'est pas vrai, À & B est vrai 
(A non inclus dans B) 


Exemples : 


— set Int | 4, 5} 

{9, 12, 17} 

16, 9), (3, 12), (3, 17), (4, 9), 
(4,12), (4,17), (5,9), (5,12), (5,17)} 


Soit G = {(3, 9), (3, 12), (4, 12)} : graphe de la rela- 
tion. G définit en fait la relation R : . divise … » (au 
sens de la division euclidienne habfuelle de reste nul) 
de E vers F. 

En effet : 3 divise 9, 3 divise 12 et 4 divise 12, mais 
3 ne divise pas 17, 4 ne divise pas 9, etc., donc 


(3,17) #G; (4,9) éG, etc. 


Le graphe G d'une relation binaire de E vers F est 
donc bien l'ensemble des couples (x, y) de Ex F tels 
que x est lié à y par la relation : 


G={(XY)EEXF | xR y} 


— Soit E un ensemble, Ÿ (E) l'ensemble de ses 
parties. L'inclusion entre deux parties de E est une rela- 
tion de Ÿ (E) vers lui-même. Le graphe de cette relation 
est l'ensemble des couples (A, B) de parties de Etels 
que A & B. 

Diagramme sagittal d’une relation 

C'est le diagramme « avec les flèches », à partir des 
diagrammes de Venn des ensembles. Chaque flèche a 
pour point de départ un élément de l'ensemble de départ 
et pour point d'arrivée l'élément de l'ensemble d'arrivée 
lié à l'élément de départ considéré. 

Pour l'exemple précédent : 


ï H 
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Tableau cartésien 
Toujours avec l'exemple précédent, on met une croix 
dans chaque case correspondant à un élément du 
graphe : 
Richard Colin 


Ce tableau s'appelle «tableau cartésien » par analogie 
avec le plan muni d'un système de coordonnées carté- 
siennes. Remarquons que représenter le produit cartésien 


E XF dans ce tableau revient à mettre une croix dans 
chaque case. 
Relation binaire dans un ensemble 

Lorsque l'ensemble d'arrivée est le même que l'en- 
semble de départ (E — F), on peut définir une relation R 


de E vers lui-même ou une «relation R dans E». 


Exemple : 
E — {7, 4,12, 48} 

Ex E—{(7,7), (4,4), (12,12), (48,48), (7,4), (7,12), 
(7,48), (4,7), (4,12), (4,48), (12,7), (12,4), 
(12, 48), (48, 7), (48, 4), (48, 12)} 
G={(7,7), (4, 4), (12, 12), (48, 48), (4, 12), (12, 48), 
(4, 48)} 
G est le graphe de la relation « … divise … » définie 
dans E; mais l'on remarquera que les couples (7, 7) 
(4, 4), etc., ne peuvent faire partie du graphe que parce 

que E est à la fois ensemble de départ et d'arrivée. 

Le diagramme sagittal est ici : 


Fo 
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T 
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Propriétés des relations binaires dans un ensemble 

Soit E un ensemble et R une relation binaire définie 
dans E. La relation R définie dans E peut être : 

x Réflexive 

Pour tout xeE, x R x. Tout élément de E est lié à 
lui-même. 

Exemple : 

— l'égalité est réflexive : pour tout objet a, a = a; 

— la relation de parallélisme dans l'ensemble des 
droites du plan est réflexive : toute droite est parallèle 
à elle-même (deux droites du plan sont parallèles si et 
seulement si elles sont d'intersection vide ou confondues). 

x Antiréflexive 

Pour tout xEeE, x non x. Aucun élément de E 
n'est lié à lui-même. 

Exemples : 

— larelation < «strictement inférieur » définie dans N 
(ou dans R) est antiréflexive : quel que soit le nombre 
x, x n'est pas strictement inférieur à x; 

— la relation « D est perpendiculaire à D’ » dans 
l'ensemble des droites du plan est antiréflexive : aucune 
droite n’est perpendiculaire à elle-même. 

x Ni réflexive, ni antiréflexive 

Il existe xEeE, YE&E tels que xnonR x et y R y. 
Certains éléments de E sont liés à eux-mêmes, d'autres 
non. 

Exemple : la relation «… divise … » dans l'ensemble 
H=10; 1,23: 
En effet, 1 divise 1, etc., mais O ne divise pas 0. 
Dans les deux derniers cas, la relation est non réflexive. 


x Symétrique 

Pour tous xeE,yeE:xRy= y x. Six et y sont 
liés par R, il en est de même pour y et x. 

Exemple : 
— l'égalité est symétrique pour tous objets x, y: 
K=yS y—=Xx 
— la relation « D est parallèle à D’ » est symétrique : 
DZ D'= D’ D 

— la relation « D est perpendiculaire à D’ » est sy- 
métrique : D L D’= D’ L D. 

X Antisymétrique 

PourtousxeE, yeE:xRy et yRx— x = y. 

Il n'existe pas deux éléments distincts appartenant à 
l'ensemble E qui soient liés « dans les deux sens » à la 
fois, c'est-à-dire que l’on ait à la foisxR yet y R x. 

Exemples : 
— la relation < dans N 


3x ét xXx<3x—=S 


— la relation d'inclusion dans Ÿ (E), ensemble des 
parties de E. 

x Ni symétrique ni antisymétrique 

Il existe x, y, z, t, éléments de E tels que : 


xRy et yRx 
et zRt et tnon Rz 


Il existe des couples liés symétriquement et d'autres 
qui ne le sont pas. 

Dans les deux derniers cas, la relation est non sy- 
métrique. 


x Transitive 
PourtousxEE,yYEeE,zeE 
[ou pour tout (x, y,z)E ExExE]: 


xRy et yRz—x®Rz 


Exemples : 
— l'égalité est transitive pour tous les objets a, b, c: 
a=betb=c—=a=c; 
— la relation < est transitive : 
3<5et5<7—>3< 7 
x Non transitive 
Ilexistex€E, yEE, z€eE tels que : 


xRy et yRz et xnonRy 


Exemple : dans un ensemble{x, y, z, t} « rangé » ou 
ordonné, la relation : 
y est le successeur immédiat (ou le « voisin ») de x 
z est le successeur immédiat (ou le « voisin ») de y 
n'entraîne pas que z soit le successeur immédiat de x. 
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Relation d'équivalence 

Une relation binaire définie dans un ensemble E qui 
est réflexive, symétrique et transitive est une relation 
d'équivalence dans E. 

Exemples : 

— l'égalité : x= y< x et y sont un seul et même 
objet. L'égalité sur un ensemble E est une relation d'équi- 
valence dont le graphe est l'ensemble des couples (x, x), 
donc la diagonale de Ex E; 

— soit la relation définie dans N x N par: 


GR (X,y)SIx—y=x —y'ouy—x=y —x] 


R est une relation d'équivalence (deux couples d'entiers 
sont équivalents s'ils ont la même différence entre leurs 
projections). 

D'une façon générale, les relations, définies sur un 
ensemble, fondées sur « même », sont des relations 
d'équivalence. 

Par exemple, dans Ÿ (E), ensemble des parties de E, 
la relation « À a le même cardinal que B », avec A et B 
éléments de Ÿ (E) (donc À et B parties de E), est une 
relation d'équivalence. En effet : À a le même cardinal 
que À; si A et B ont le même cardinal, B et À ont aussi le 
même cardinal; si À et B ont le même cardinal et si 
B et C ont le même cardinal, alors A et C ont le même 
cardinal; et ceci pour toutes parties À, B, C de E (le 
nombre d'éléments d’un ensemble est le cardinal de 
cet ensemble). 

Éléments équivalents 

Soit R une relation d'équivalence sur E. Deux éléments 
x et y de E liés par R sont dits « équivalents suivant la 
relation R » ou « équivalents modulo R ». 

Dans certains cas, on utilise la relation d'équivalence 
notée : x = y (mod.a), quiselit: «x congru à y modulo a». 
C'est la congruence modulo a, qui exprime que deux 
éléments x et y d'un ensemble répondant par ailleurs à 
certaines conditions (c'est un groupe commutatif noté 
additivement) sont liés si x— y est un multiple de a 
(il existe g entier, positif ou négatif, tel que x — y — ga). 

Exemple : dans Z muni de l'addition : 85 
(mod. 4), car 85 — 65 — 5 x 4, de même 16 
(mod. 2). 

(Z est l'ensemble des entiers relatifs, c'est-à-dire des 
entiers positifs ou négatifs.) 

Classe d'équivalence modulo R, 
ou suivant la relation R 

Soit x un élément de l'ensemble E. L'ensemble des 
éléments y de E liés à x, donc équivalents à x, est « la 
classe d'équivalence de x modulo  », ou « la classe 
d'équivalence de x suivant la relation R »: 


Cr={yeElxRy)} 


e . 
On note également x la classe d'équivalence de x. 
Tout élément d'une classe d'équivalence est un repré- 
sentant de cette classe. 
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Escher Foundation - Haags Gemeentemuseum 


M. C. Escher, L'air et l’eau | - 1938 


À Y A partir d'un « pavé » type, ou motif, il s'agit de recouvrir tout /e plan, sans 
trou, en disposant régulièrement le même pavé. Ce motif est dessiné de facon à 
ce que le complémentaire de l'ensemble des poissons soit un ensemble d'oiseaux 
(naturellement, l'ensemble de ces motifs forme une partition du plan; et l'ensemble 
des motifs, complets ou partiels, forme sur une page — une partie du plan — une 
partition de cette page). 


M. C. Escher, Mosaïque de l'AI 


—" LT = 70 LEFT Si deux éléments sont équivalents, leurs classes d'équi- 
\ £ valence sont égales : 


xXRy = Cr=Cy & yeC & xeCy 


Partition d'un ensemble 
Soit E un ensemble. Un ensemble {A1, Az, …, An} de 
parties de E forme une partition de E si et seulement si : 
— Aucune partie n'est vide : 


pourtout/: A Æ © 
1<i<n 


— L'intersection de deux parties distinctes est vide : 


pourtout/, pourtout/, / £/j:A;f A;= 
1<i<n 1<j<n 


Escher Foundation - Haags Gemeentemuseum - The Hague 


8 — La réunion de toutes les parties est égale à E. 
a UA=E 

mn) 1<i<n 

Lei 

2 Une assiette qui se casse en quelques morceaux fournit 
è une bonne image d'une partition, souvent involontaire 
# dans ce cas! 

à Exemple : E = {0, 1, 2, 3, 4,5, 6, 7} 

& A1 = {0, 2, 4, 6} 

h A2 = {1,8, 5} 

ü As = {7} 


{A1, A, As} est une partition de E. 


Richard Colin 


Partition de E en classes d'équivalence 
L'ensemble des classes d'équivalence suivant une 
relation R définie sur E est une partition de E. 
Exemple : soit E = {a, b, c} 


T (E) = { &, {a}, {b}, {c},{a, b}, {a c},{b, c}, {a, b, c} } 


Soit R la relation d'équivalence définie sur E par : 
«.… a le même cardinal que … » 
Les classes d'équivalence suivant R sont : 


A1 = {2} : ensemble des parties à O élément; 
A2 = {{a}, {b}, {c}}: ensemble des parties à 1 élément; 
= {{a, b}, {a, c}, {b, c}} : ensemble des parties à 
2 éléments; 
Aa= {{a, b, c}} : ensemble des parties à 3 éléments. 


On remarquera que A1 = {Z} n'est pas vide, mais est 
un singleton, ensemble à un élément (ici cet élément est 
« l'objet » g). 

Ces classes A1, A2, A3, A4 forment bien une partition 

T (E) : {Az, Ac, A3, A4}. 
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Ensemble quotient 

L'ensemble des classes d'équivalence modulo la rela- 
tion d'équivalence R définie sur l’ensemble E est l'en- 
semble quotient de E par la relation R, noté E/. 
Relations d'ordre dans un ensemble 

Une relation définie dans un ensemble E qui est : 
réflexive, antisymétrique et transitive, est une re/ation 
d'ordre large. 

Exemples : 

— la relation < (inférieur ou égal) dans R est une 
relation d'ordre large; 

— l'inclusion définie dans 
d'ordre large. 

Une relation définie dans un ensemble E qui est: anti- 
réflexive, antisymétrique et transitive, est une re/ation 
d'ordre strict. 

Exemple : 
dans R. 

Une relation d'ordre (large) définit un ordre sur E: 
E muni de cette relation d'ordre, est un ensemble 
ordonné. 

On note souvent < ou une relation d'ordre 
large, même s'il ne s’agit A relations d'inégalité 
habituelles (sur N, Z, R). 

Une « relation d'ordre » (sans précisions) est une 
relation d'ordre large. Remarquons qu'une « relation 
d'ordre strict » n’est donc pas une relation d'ordre. 


T (E) est une relation 


la relation < (strictement inférieur) 


Ordre total, ordre partiel 

L'ordre défini sur un ensemble E peut être : 

x Total: si deux éléments quelconques de E peuvent 
être toujours classés ou comparés l’un par rapport à 
l'autre. 

Pour tout (x Y)}EExXE, xRy ou yRx. 


Exemple : la relation < dans R définit un ordre 
total sur R. 
x Partiel : il existe au moins deux éléments de E 


qui ne peuvent être classés ou comparés l'un par rapport 
à l'autre. 
Il existe (x Y)EExE:xnonRy et ynon Rx. 
Exemples : 

— L'inclusion dans $ (E) définit un ordre partiel (par 
exemple, on ne peut classer par inclusion {a} et {b, c} 
ou {a, b} et {a, c}): 

— La relation « … divise … » définit dans N un ordre 
partiel (il existe par exemple [3, 20] tel que ni 3 ne 
divise 20, ni 20 ne divise 3). 

Il y a donc deux possibilités pour un « ordre large »: 

— ordre large et total 

— ordre large et partiel 
et deux possibilités pour un « ordre strict » : 

— ordre strict et total 

— ordre strict et partiel. 


Fonction de E dans F 


Soit R une relation de E vers F, de graphe G : R est une 
fonction si, et seulement si pour tout (x, y) € G, et 
pour tout (x’,y)EeG:x=x = y = y! 

C'est-à-dire que tout élément de l'ensemble de départ 
est lié au plus à un élément de l'ensemble d'arrivée 
(donc soit à aucun élément, soit à un élément). 

On note en général une fonction par une lettre minus- 
cule : f, g, h, …; une flèche (— ou +) relie les ensembles 
de départ et d'arrivée : 


f 
«f:E—=Fy où «f:ER Fy où «E—F» 


Exemples : 


Exemple : dans E = { 3, 4, 5, 20 }, le diagramme 
sagittal de la relation d'ordre total “.… < …” est : 


i= 
© 
O1 
T 
ra 
& 
a | 
> 
LE 


3, 4, 5, 20 }, le diagramme 


divise...” est : 


Exemple : dans E = | 
sagittal de la relation “.…. 


8 ne divise ni 4, ni 5, ni 20 (le reste de la division 
de ces nombres par 3 n’est pas nul) 


Richard Colin 
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< Représentation 
schématique de la partition 
d'un ensemble E. 


<« Représentation 
schématique 

d'une partition de Ÿ (E) 
en classes d'équivalence. 


< Relation d'ordre total. 


<« Relation d'ordre partiel. 


Domaine de définition d’une fonction 

Soit / une fonction de E dans le graphe G. L'ensemble 
des éléments de E qui sont liés à un (et un seul) élément 
de F est le domaine de définition de la fonction f, noté D; 
en général. 


D;={xeE lilexiste y: (x y) € G} 
Exemples :/:R =R 
10x+2 
X7x+3) G&—5) 
On ne peut diviser un nombre par zéro; donc il faut 


que (5x + 3) et (x — 5) soient non nuls. Les valeurs 
qui annulent le dénominateur étant : 


— : et 5, le domaine de définition sera : 


SR r Ets 
Éd de 3 3 
Fes u és u]s + «f 
D; est le complémentaire dans R de l'ensemble : 
12881 
5°) 
Remarquons que sig:N +R 


10x—+2 


FFBxE D 0) 


D, = N—{5} = (5 


puisque 5 est le seul entier naturel qui annule le dénomi- 
À ‘ 10x+2 
nateur, donc pour lequel l'expression (5x +3) (x —5) 
n'est pas définie. 
Application 
C'est une fonction dont le domaine de définition est 

égal à l'ensemble de départ tout entier. Tout élément x de 
l'ensemble de départ est donc lié à un et un seul élément y 
de l'ensemble d'arrivée; y est l'image de x, notée f (x) 
[qui se lit f de x] : 

f application de E dans F, de graphe G (ou de graphe 
fonctionnel G) < pour tout x € E, il existe un et un seul 
élément y € F tel que (x, y) € G. 


Exemple :f:R =R 
x—ax+b avec a,bER 
L'image de x est : f (x) — ax + b 
(sif:x=3x+2, f(5) = 17) 


En écrivant y = f (x), c'est-à-dire y — ax + b,on 
retrouve l'équation d'une droite dans un système de 
coordonnées cartésiennes. 

Image d'une partie A de E 

Soit f:E + F une application et À une partie de E: 
l'ensemble des éléments de F qui sont l’image d'au moins 
un élément de A est l’image de A parf: 


f(A) = {yeF |ilexisteaumoinsunxeAtelquey=f(x)} 


Exemple : 
f:R-=R 
x—>3x2+1 
f(5)= 3 x 5241 = 76 
f (10) = 3 x 102 + 1 — 301 
FD) = 8x 1241—=4 


Donc, si A = {1, 5, 10} est une partie de R, l'image de A 


par f est : 
f (A) = £f (1), f (5), f (10)} 
— {4, 76, 301} 


Image réciproque d’une partie 
de l’ensemble d'arrivée 

Soit B une partie de F. L'ensemble de tous les éléments 
de E dont l'image est élément de B est l'image réciproque 
de B, notée f-1 (B). 


Exemple : avec f:R —R 
x—3x2+1 
Si B — {49, 76} 


f-1 (B) = {— 4, 4, —5, 6} 
carf(—4)=f(4)= 49 et f(—5) = f (5) — 76. 
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Ensemble des applications de E dans F 

L'ensemble de toutes les applications de E dans F 
est noté FE, ou & (E,F). C'est une partie de l'ensemble 
T (EXF), puisque le graphe de toute application est 
une partie de Ex F. 


SiE— F, on note cet ensemble EE ou & (E). 


Exemple : RR = % (R) est l'ensemble de toutes 
les applications de R dans R. 
Application surjective 
Si l'image de l'ensemble de départ, f (E), est égale à 
l'ensemble d'arrivée F, l'application est surjective : 
f application de E dans F: 
f surjective < f (E) = F. 
Exemple :f:R — R:(R: est l'ensemble des réels 
positifs). 
x— x? 


Application injective 

Soit f une application de E dans F. 

Si à deux éléments distincts x et x’ correspondent 
deux images distinctes, l'application est injective : 


f injective < pour tout (x, x)EEXxE: 
XÉX=T(O ET (D 

< pour tout (x xX)EeExE: 
FOOT ISXxX=Yx 


(si deux éléments ont la même image, ils sont égaux). 
Application bijective 

C'est une application qui est à la fois injective et sur- 
jective. 

Tout élément de E a alors une et une seule image, 
et tout élément de F est alors image d'un et d’un seul 
élément de E. 

Composition de deux applications 
Soit E, F, G, trois ensembles, et f, g deux applications : 
f:E—F et g:F—G 
e4c. 

L'application composée « g o f » qui se lit « g rond f» 

est une application de E dans G définie par : 


pourtoutxeE:gof(x) = g {f(x)} 


on peut également noter E—F et 


Exemple : 
fiN = R: 
x—3x+2 
g:R:—R 
x = 5x2— 100 
gofi:N >R 


x —=5(3x-—+ 2)}2— 100. 
On ne peut ici définir f o g car l'ensemble d'arrivée de g 
n'est pas l'ensemble de départ de f. 
On peut écrire également : g: R: +R 
y > 5y2— 100 
et, en posant y = f (x) :gof(x) = g (f (x)) = g (y) 
dans l'exemple ci-dessus 
y=3x+2; 
gof(x)=g(y)=5y?—100 = 5 (3x—+ 2)}2—100. 
Application identique dans un ensemble 
C'est l'application qui, à tout élément de l'ensemble, 
associe ce même élément. On la note Ix, ou dE 
LE :E—=E 
X x 


Son graphe est évidemment l'ensemble des couples 
(x, x) de Ex E, donc la diagonale de Ex E. 
Application réciproque 

Sif:E — Fest une bijection, l'application réciproque 
f-1: FE est l'application telle que gof=fog = 1x. 


Exemple : soitf:R—R 
x— 3x +2. 


L'application réciproque estf-1: R—R 
x— L (x — 2) 
Vérification : 
f-1of(x =3(Gx+ 2) — 2) = x = idx 


fof-1 (x) = 3 x—2)) L<èsre fl 


LES ENSEMBLES 


La notion d'ensemble est une notion primitive des mathé- 
matiques; nous ne donnerons donc pas de définition 
d'un ensemble, pas plus qu'en géométrie, par exemple, on 
ne définit ce qu'est un point. Cependant il ne faut pas 
en conclure que l'usage du mot ensemble est arbitraire, 
au contraire il est strictement régi par des axiomes, sans 
quoi l’on aboutirait rapidement à des contradictions. 

En reprenant l'exposé des diverses notions introduites 
au chapitre précédent, nous allons dégager à chaque 
étape les axiomes nécessaires pour garantir l'existence 
cohérente d'objets mathématiques appelés ensembles. 
Une véritable présentation axiomatique de la théorie des 
ensembles reposant sur une bonne connaissance de la 
logique, le lecteur pourra se reporter à la bibliogra- 
phie. 

Dans une seconde partie, nous montrerons comment, 
à l'aide de méthodes reposant sur les propriétés des 
ensembles, on peut étendre les notions usuelles de dénom- 
brement et de numération. 


Les axiomes 


Égalité - appartenance 


Le principal concept (non défini) de la théorie des 
ensembles est celui d'appartenance. Si x appartient à À, 
on dira que x est un élément de À, et on écrira: xE A; 
la négation étant notée x é A. 

Une relation élémentaire entre ensembles est l'égalité 
A = B. 

La notion d'appartenance est liée à celle d'égalité 
de la façon suivante : deux ensembles sont égaux si, 
et seulement si, ils ont les mêmes éléments (axiome 
d’extensionalité). 

L'égalité entre ensembles est une relation : 

— réflexive : À — À pour tout ensemble A; 
— symétrique : si À — B, alors B = A; 
— transitive : si A = Bet B = C, alors A = C. 


Inclusion - sous-ensembles 


Si À et B sont deux ensembles et si tout élément de A 
est élément de B, on dira que A est inclus dans B, 
ou que À est un sous-ensemble de B, ou que A est une 


partie de B; on écrira indifféremment : 


A B B = A 


L'inclusion entre deux ensembles est une relation : 
— réflexive : À € À pour tout ensemble A; 
— transitive :S AS BetB«C,alors ACC; 
— antisymétrique : si A € BetB € A, alors À = B. 
La plupart des démonstrations d'égalité entre deux 
ensembles se font à l’aide de cette dernière propriété. 


L'axiome de sélection - paradoxe 
de Russell 


À part l'axiome d'extensionalité, tous les principes 
fondamentaux de la théorie des ensembles ont pour objet 
la construction de nouveaux ensembles à partir d'anciens. 
On le fera à l'aide de deux types d'énoncés : 


X£€A A = B 


par application des opérateurs logiques usuels et des 
règles sur ces opérateurs (voir Logique), mais il faudra 
imposer une restriction supplémentaire, sous peine de se 
heurter à des paradoxes. 

En effet supposons que S (x) soit un énoncé du type 
précédent. On peut définir un ensemble pour 


X = {x|S (x)} 


X étant l'ensemble de tous les x pour lesquels la pro- 
priété S (x) est vraie 
et en prenant pour S (x) l'énoncé x € x 


X={x|xéx} 


on constate alors que la proposition Xe X est antino- 
mique car : — si X € X alors X élément de X vérifie la pro- 
priété caractéristique X£X; 

— siX£X la propriété S (X) est vraie donc X € X; dans 
les deux cas on aboutit à une contradiction. 

Ce paradoxe mis en évidence par Russell peut être 
illustré de façon plus concrète par l'exemple suivant : 
«Si le barbier d'un village rase tous les habitants qui ne se 
rasent pas eux-mêmes, ce barbier se rase-t-il [lui-même ? 
S'il se rase il doit appartenir à la catégorie de ceux qui ne 
se rasent pas eux-mêmes, mais s'il ne se rase pas, il 
appartient au groupe de ceux qu'il doit raser. » Dans les 
deux cas, qui sont les seuls possibles, il y a contradiction. 
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À Première notion 
d'ensemble : À, 
l’ensemble des formes 
jaunes; B, l’ensemble 
des formes rouges. 


Richard Colin 


> Page ci-contre, en haut, 
à gauche, Bertrand Russell, 
mathématicien, 
philosophe et sociologue, 
est d’abord un logicien, 
l’un des promoteurs 

de la logistique. 

On lui doit notamment 
Principia mathematica 
qu'il rédigea 

en collaboration avec 

N. Whitehead en 1903. 


On élimine ce paradoxe en posant le principe fonda- 
mental suivant : à tout ensemble A et toute condition 
S (x), il correspond un ensemble B dont les éléments sont 
exactement les éléments de À pour lesquels S (x) est 
vraie (axiome de sélection). 

Ainsi, pour tout ensemble À, on peut construire l'en- 
semble B tel que : 


B—f{xeA IS (x)} 


Les éléments de B sont tous les éléments de À pour 
lesquels S (x) est vraie. 

En particulier : B—={xe A]|xéx} est un ensemble, 
appelé partie russellienne de A. Cet ensemble est tel 
que B ÉA. 

En effet, si B € B, alors B vérifie les conditions impo- 
sées aux éléments de B, à savoir Be AetBéB:siB£B, 
alors ona BéAouBEB. Seule la deuxième hypothèse 
n'aboutit pas à une contradiction, mais à condition que 
B£A. 

L'ensemble A est arbitraire, on voit ainsi qu'il existe 
toujours quelque chose (B) qui n'appartient pas à un 
ensemble quelconque A. 

En d'autres termes, rien ne contient tout. De même, on 
démontre que l’ensemble de tous les ensembles n'existe 
pas. 

Nous savons maintenant qu'il est possible de construire 
un nouvel ensemble en donnant une propriété caracté- 
ristique de certains éléments d'un ensemble déjà connu. 
C'est ce qu'on appelle la définition en compréhension. 


Ensembles particuliers 


Faisons l'hypothèse qu'il existe un ensemble A, ce 
qui sera justifié ultérieurement (on posera comme axiome 
l'existence d‘'ensembles infinis). On peut construire : 


{xEeAÏXxSZÆ x} 


cet ensemble n’a aucun élément, c'est l'ensemble vide, 
noté Z. On démontre que l’ensemble vide est sous- 
ensemble de tout ensemble. 

Si a et b sont deux ensembles, il existe un ensemble A 
tel quea£Aet bE À, c'est ce qu'affirme l'axiome de la 
paire. 

L'ensemble{xe A|x—a ou 
que a et b est noté {a, b}. 

Si b = a alors {a, b} = {a, a} — {a} 

a est le seul élément de l'ensemble {a}. 

Ainsi, on peut construire l'ensemble {Z} qu'il ne faut 
pas confondre avec Z, car ce dernier ensemble n'a pas 
d'élément, alors que {Z}en a un: . 


x = b} qui ne contient 


Unions et intersections 


C'est un nouvel axiome qui va nous permettre de réunir 
les éléments d'une famille d'ensembles en un ensemble 
global : 

pour toute famille d'ensembles %, il existe un 
ensemble qui contient tous les éléments appartenant à au 
moins un ensemble de la famille (axiome de la réunion). 


On note cet ensemble : U Æ ou U X. 
XEF 
Dans le cas particulier d'une paire {A, B} on adopte 
la notation À U B. De la définition de la réunion il résulte 
que x appartient à À U B si, et seulement si x appartient 
soit à À, soit à B, soit aux deux: 


AUB={x|xEeA ou xeB} 
Les axiomes d’extensionalité et de sélection suffisent 
à définir et à assurer l'unicité de l'intersection d'une 
famille non vide d'ensembles. 


Comme Æ_S, on peut considérer un élément 
quelconque A de #, alors : 


{xe A |xe X pour chaque X de F} 


définit un ensemble qui, en fait, ne dépend pas du choix 
arbitraire de A. On note cet ensemble : 


NS où MX 
XF 
et dans le cas d'une paire 
ANB={xEeA|xEeB}= 
{xeB|xeA}=fx|xeAetxeB}. 
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Les propriétés de la réunion et de l'intersection sont 
les suivantes : 


AUS=A 

ANg=5S 

ire. | idempotence 

AUB—=BUA 

ANB—BMA | CoMmutativité 
AU(BUc)=(AUB) UC] mn 
AnBNcC)=(ANBNC | associativité 
an en e. =. . absorption 
AN(BUC)=(ANB)U (ANC) distri- 
AU(BNC)= (AU B) N (AU C) butivité 
A © B si et seulement si A U B = B 

A © B si et seulement si A N B = A. 


Complémentaires et parties 


Si À et B sont deux ensembles, la différence entre A 
et B, ou complémentaire de B dans À, est l'ensemble 
défini par : 

A—B={xeA|xéB}=[,B 

Il n'est pas nécessaire de supposer B € A. 

Si À et B sont des sous-ensembles d'un même en- 
semble E, on posera [kA = A et [kB = B. 


Les propriétés fondamentales de la complémenta- 
tion sont données par : 


ANB—=AUB | 
AUB=ANB/) 
À © B si et seulement si A N B = 
A « Bsiet seulement si AUB=E 
A © B si et seulement si B & A. 


lois de Morgan 


On appelle différence syeaiaus de À et de B 
l'ensemble À À B — (A — B) U (B — A). 
Cette opération est commutative, associative et est 
telle que AAÂAZ—=A et AAA= GS 
La collection de tous les sous-ensembles d'un ensemble 
donné E est encore un ensemble, c'est ce qu'assure 
l'axiome des parties d'un ensemble : 
F (E={X|X<E} ensemble des parties de l'en- 
semble E. 
Ainsi : 
F ({, b}) = {2, {a}, {b}, {a b}} 
g)={2} Te} ={2,{2}} ete. 


Définition d’un ensemble 


Définition en extension 

E = {1,2,8,4,6,12} 

On dresse la liste des éléments de 
lensemble considéré. 


Définition en compréhension. 


E={xl xeN et x divise 12 } 


se lit «ensemble des x tel que x est 
un entier naturel et x divise 12 ». 


Plus généralement : 


E={xeAIS(x)} 

« les éléments de E sont tous les 
éléments de A pour lesquels la 
propriété S (x) est vraie. » 


Richard Colin 
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Couple - produit cartésien 


La notion de paire {a, b} va être complétée par celle de 
paire ordonnée ou couple. 

Par définition, le couple (x, y) est l'ensemble 
{x {x, v}}. définition due à Kuratowski. 

x est le premier terme (première projection) du couple, 
y le second terme (seconde projection). 

Alors que {a,b}—{b,a} en général (si a £ b) 
(a, b) £ (b, a). 

On démontre que deux couples sont égaux si, et seu- 
lement si leurs projections sont égales. 

Soit deux ensembles A et B, existe-t-il un ensemble 
qui contienne tous les couples (a, b) avec a dans A et b 
dans B ? 

Comme 23€ À, {a} € A; de même {b} € B, donc 
{a,b} € AU B.Parsuite{a}ef (AU B);{a,b}eT (A UB) 
et la paire {{a}, {a, b}} est un sous-ensemble de f (A U B), 
donc appartient à Ÿ (S (A U B)). 

Tous les couples (a, b) appartiennent à l'ensemble 
T (TS (A Ü B)) dès que a € A'et b € B. L'axiome d'exten- 
sionalité permet d'assurer l'existence d'un ensemble que 
l'on notera À x B tel que : 

AXx B=— {xes (F (AU B)) |x= (2,b),aEA,beB} 
l'axiome de sélection en garantit l'unicité. 

A x B={(a,b) |a€ A, bEeB}estle produit cartésien 
des ensembles A et B. 


Relations binaires 


Étant donné deux ensembles A et B, on appelle graphe 
ou relation de A vers B tout sous-ensemble R du pro- 
duit cartésien À x B. 

A est l'ensemble de départ, B l'ensemble d'arrivée. 
Si (x, y) € R, on dit que x est un antécédent de y, y est 
une image de x par ‘R. Au lieu de noter (x, x) ER, on 
pose souvent x R x. 

Si À = B, alors tout sous-ensemble de À x A définit 
une relation binaire sur A. 

Ainsi la relation d'inclusion entre les sous-ensembles 
d'un ensemble U est caractérisée par le sous-ensemble de 
T (U) x Ÿ (U) formé des couples (A, B) tels que À & B. 


Préordre et ordre 


Une relation binaire dans un ensemble Eestune relation 
de préordre (ou un préordre) si elle est réflexive et 
transitive, c'est-à-dire vérifie : 

— pour tout x, x R x; 
— six R yet y Rzalors x R z. 
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À Intersection : /’ensemble A des enfants qui portent au moins un vêtement rouge 
et l'ensemble B des enfants qui portent au moins un vêtement bleu se coupent: 
l'enfant habillé de rouge et de bleu correspond à l'intersection 

des ensembles A et B. 
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À inclusion : l'ensemble des triangles jaunes est inclus 
dans l’ensemble des formes de couleur jaune. 
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Une relation binaire dans un ensemble E est une rela- 
tion d'ordre (ou un ordre) si elle est réflexive, anti- 
symétrique et transitive, soit : 

— pour tout x, x R x 
— six R yet y R x, alors x = y 
— six RyetyRz, alors x R z. 

La relation d'inclusion dans Ÿ (E) est une relation 
d'ordre. Divers symboles sont employés pour traduire une 
relation d'ordre, citons <, <, €, €, K, … 

La relation d'ordre est totale si deux éléments quel- 
conques de l'ensemble sont comparables. La relation 
d'inclusion dans Ÿ (E) n’est pas un ordre total, c'est un 
ordre partiel. Un ensemble sur lequel on a défini une 
relation d'ordre est dit ordonné. 

Soit (E, <) un ensemble ordonné et A une partie de E. 
L'élément m de E est un majorant de A si m est supérieur 
à tous les éléments de A : 


pourtoutxeAonax< m. 


Si z est un élément de A tel que pour tout x de À, 
x < y, u est le plus grand élément de A. Enfin on 
appelle borne supérieure de A le plus petit des majo- 
rants de A. De facon analogue, on définit les notions 
duales des précédentes : minorant, plus petit élément, 
borne inférieure. 

Si toute partie non vide d'un ensemble ordonné 
admet un plus petit élément, l'ordre défini sur cet ensemble 
est un bon ordre. 


Équivalence 


On appelle relation d'équivalence ou équivalence 
sur un ensemble E tout préordre R symétrique sur E, 
c'est-à-dire une relation binaire sur E qui est : 

— réflexive : pour tout x, x R x: 
— transitive : si x R y et y R z, alors x Rz; 
— symétrique : si x R y, alors y R x. 

Lorsqu'il existe une relation d'équivalence sur E, 
l'image R (x) de x par R est appelée classe d’équiva- 
lence de x modulo À; on la note généralement x. R étant 
réflexive, x contient toujours un élément (lui-même), donc 
XZ£ S ; les propriétés de R entraînent que si x y alors 
Xx = y et réciproquement siy — X, alors x ff y. 

Pour connaître une classe d'équivalence, il suffit d'en 
citer un élément, ce sera le représentant de la classe. 

L'ensemble des classes d'équivalence forme une parti- 
tion de E, c'est-à-dire un recouvrement de E en sous- 
ensembles disjoints. Cet ensemble est l'ensemble quo- 
tient de E par la relation d'équivalence R: on le note 
E/R. On a E/R « T (E). 


Fonction - Application 


Une relation de E vers F est une fonction si, pour tout 
couple (x, y) et tout couple (x’, y’) appartenant à @, 
x = x’ implique y = y’ (condition d'univocité). 

L'ensemble {xe E | (x, y) € R} est le domaine, ou 
encore le domaine de définition, de la fonction. 

Une application de E vers F est une fonction dont le 
domaine de définition est E tout entier. On emploie sou- 
vent la notation f:E —F. 

L'ensemble de toutes les applications de E dans F 
est un sous-ensemble de l'ensemble des parties Ÿ (E x F): 
il sera noté F£ où % (E, F). 

Si À est un sous-ensemble de E, l'image de A par 
l'application f est l'ensemble des éléments y de F pour 
lesquels il existe au moins un x dans A tel que f (x) = y. 
On appelle image de f et on note Im 7 l'ensemble f (E). 
On désigne par f-1 (B) l'ensemble des éléments x de A 
pour lesquels f (x) appartient à B (B étant un sous- 
ensemble de F). 

Par définition, une application f: E — F est surjective 
quand f(E) — F. Elle est imjective si f (x) = f (x’) 
implique x = x’. Elle est bijective quand elle est à la fois 
injective et surjective. 

Si f est bijective, il y a correspondance univoque 
entre E et F, à tout x appartenant à E correspond un, 
et un seul, y — f (x), alors on peut associer à tout y 
l'unique x ainsi défini. L'application F = E correspon- 
dante est dite application réciproque de f, on la note : f-1. 

On démontre qu'il existe une bijection entre l’ensemble 
R (E) des équivalences sur E et l'ensemble Ÿ (E) des 
partitions de E; il revient donc au même de se donner 
explicitement une équivalence sur E ou de se donner la 
partition correspondante. 


Dénombrement 


Nous allons maintenant présenter les principales 
notions attachées aux problèmes de dénombrement 
par l'intermédiaire des cardinaux et des ordinaux. 

Dans le langage courant, un nombre cardinal est celui 
qui mesure la quantité (n objets), un nombre ordinal est 
celui qui indique l'ordre (n-ième objet); nous allons 
montrer comment ces notions peuvent s'étendre aux 
ensembles infinis. 

Nous supposerons établie l'existence de N, ensemble 
des entiers naturels (voir Mombres) dont la construction 
repose sur un nouvel axiome, l'axiome de l'infini. 
Nous admettrons l'axiome du choix (le produit cartésien 
d'une famille d'ensembles non vides est non vide ou, 
ce qui est équivalent, pour tout ensemble E il existe une 
application f de Ÿ (E) — S dans E qui à tout X non vide 
inclus dans E associe un élément x de X). 


Nombres cardinaux 


A la base de toute tentative de dénombrement se trouve 
la notion d'équipotence : deux ensembles À et B sont 
équipotents s'il existe une bijection de A sur B. 

Cette relation est manifestement réflexive, symétrique 
et transitive, mais nous ne pouvons pas parler de relation 
d'équivalence, car nous n'avons défini les relations binaires 
que sur un ensemble, et l'ensemble de tous les ensembles 
n'existe pas. 

Par exemple, l'ensemble des nombres pairs est équi- 
potent à l'ensemble des nombres impairs (considérer 
l'application qui à 2n associe 2n—1 pour n > 1); 
l'ensemble des nombres pairs est équipotent à N (à n 
on associe 2 n). Ces trois ensembles sont donc équi- 
potents entre eux. 

Le second exemple met en évidence une propriété 
importante de N : l'existence d'une bijection de N sur 
une de ses parties propres (7 N). Pour Dedekind, un 
ensemble infini est un ensemble équipotent à une de ses 
parties propres. Une autre définition est la suivante : 
un ensemble E est infini s'il n'existe aucun entier n 
tel que E soit équipotent à {1, 2, … n}. Si on admet l'axiome 
du choix, les deux définitions sont équivalentes. 

De deux ensembles équipotents on dit qu'ils ont même 
puissance ou encore même cardinal. On notera A 
le cardinal de A (notation de Cantor). 

Si À est un ensemble fini, par définition il existe un 
entier n tel que A soit équipotent à {1, 2, …, n}. Si B est 
un ensemble fini, il est équipotent à {1, 2, …, n'}. Alors A 
est équipotent à B si, et seulement si n = n’. On montre 
que l'on peut identifier A — B avec n. 

Si À n'est pas un ensemble fini, on dit que son cardinal 
est transfini. 


Opérations sur les cardinaux 

Soit a et b deux cardinaux, À et B deux ensembles tels 
que A=a, B—b, ANB=— SZ (cette dernière hypo- 
thèse n’est nécessaire que pour la définition de la somme), 
on pose : 

a+b—=AU 

a-b=AXxXB 

av = % (B, À); F (B, À) est l'ensemble des appli- 
cations de B dans A. 

Dans le cas où a et b sont des nombres finis, on retrouve 
les opérations usuelles, l'intérêt d'une telle méthode est 
d'étendre ces opérations aux nombres transfinis. 

Pour tous les nombres cardinaux, finis où non, les 
règles de calcul suivantes sont encore valides : 


œ 


(a+ b)+c=a (b + c) 
(a: b}:c—a: (b:c) 
a+b=b-+a 

a b=b:a 


a- (b+c)=a-b+a.c 
ac: bc = (a- b}c 
ab. a — ab+c 
(ab)c — ad:c 
Vérifions la dernière égalité. Soit À, B, C des ensembles 
tels que À = a, B = b, C = c: l'égalité sera vraie si et 
seulement si % (C,F (B,A)) est équipotent à 
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F (B x C, A). Considérons un élément générique du 
premier ensemble : à un élément z de C, on associe une 
application qui, à l'élément y de B, fait correspondre x 
dans A. La connaissance de z et y détermine donc x 
de façon unique, ce qui définit une application de B x C 
dans A. Il y a donc correspondance biunivoque entre 


F (CF (B.A))etF (B x C, A). 


Comparaison de cardinaux 


Soit a et b deux cardinaux; on dira que a est inférieur 
ou égal à b (a < b)s'ilexiste une injection d'un ensemble 
de cardinal a dans un ensemble de cardinal b. 

On démontre le résultat fondamental par le théorème 
suivant. 
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ceft 


À Page extraite de l’œuvre 
de Stevin (édition 1634), 
l‘iIntroduction des 
fractions décimales, dont 
la première édition 

a été publiée à Leyde 
(Hollande) en 1585. 


Palais de la Découverte, Paris 


D Le mathématicien 
russe Georg Cantor 
(1845-1918); 

il est surtout connu 
comme créateur de la 
théorie des ensembles. 


F. Arborio Mella 


Théorème de Cantor-Bernstein 

Soit À et B deux ensembles. S'il existe une injection 
de A dans B et une injection de B dans À, alors il existe 
une bijection de A sur B. 

Il en résulte que la relation que nous venons de définir 
entre cardinaux est antisymétrique. Elle est aussi réflexive 
et transitive, mais ce n'est pas une relation d'ordre, 
car, nous le verrons plus loin, il n'y a pas d'ensemble de 
tous les cardinaux. 


La puissance du dénombrable 


Le cardinal de l’ensemble N sera noté comme l'a fait 
Cantor par le symbole No (aleph zéro). 

Un ensemble équipotent à N est dit dénombrable. 
Pour mettre en évidence la bijection entre un ensemble 
A et N, il suffit de réussir à numéroter les éléments de A. 
Le schéma suivant indique un procédé permettant cette 
numérotation pour un produit de deux ensembles dénom- 
brables : 


411 > 412 413 —> 414 
Y A 


421 422 


On démontre ainsi que tout produit cartésien fini 
d'ensembles finis ou dénombrables est dénombrable, on 
a les règles de calcul suivantes : 


Ko — No — Ko ; NKo — Ko 
No : No — No ; No” — No 


On verra par la suite (voir Vombres) de nombreux 
exemples d'ensembles dénombrables. 


n entier naturel 
n entier naturel 


La puissance du continu 


Nous allons démontrer que l'ensemble des nombres 
réels R n'est pas dénombrable. Le cardinal de R est 
noté C (puissance du continu). Comme R contient N, 
on a nécessairement C > Ko. 

Tout d'abord, remarquons que, pour tout ensemble À, 
T (A) = 24. Ceci résulte de la bijection que l'on peut 
établir entre Ÿ (A) — Æ (A,{0, 1}): il suffit d'associer à 
toute partie X de A l'application définie sur À qui, à un 
élément y, associe 1 si y appartient à À, O sinon. 

Il existe une injection évidente de À dans Ÿ (A), celle 
qui, à l'élément a de À, associe {a} ; nous allons démontrer 


34 


(par le théorème suivant) qu'il n'existe pas de surjection 
de À sur Ÿ (A), il en résultera que À < 24. 
Théorème de Cantor 

Si A est un ensemble, l'ensemble Ÿ (A) des parties de A 
n'est pas équipotent à A. 

Soit f une application de A dans Ÿ (A) 
et soit X—{ac A |aéf(a)} 

Pour démontrer que f n'est pas surjective, il suffit de 
prouver que X € Imf. Faisons un raisonnement par 
l'absurde. Supposons f-1 ({X}) £ S, alors il existe x € A 
tel que f (x) = X. 

Deux cas sont à envisager : ou bien x € X, il s'ensuit 
que x é f (x), et par définition de X, x e X, où bien xe X, 
donc x£f(x), et comme f (x) = X, xÉX. Les deux 
cas mènent à une contradiction; donc f-1 ({X}) = @ et 
f n'est pas surjective. . 

En remarquant que % (N,{0, 1}) — 2Ko, et en se 
servant du développement binaire des nombres réels 
(voir Nombres) pour établir la bijection entre R et 
SF (N,{0, 1}), ensemble des suites composées unique- 
ment de 0 et de 1, on démontre que C — 2Xo d'où l'iné- 
galité stricte : 

No < C — 2Xo 


ce qui prouve que R n'est pas dénombrable. 
Indiquons les règles de calcul concernant Ko et C: 


C+E=É 5-6 
DÉC me PEN 
No: C— CC: Ko =C 

hs E€, NoN“o — C, C= C (2< n < Ko) 
no= 26, MO=mDE CC=20 Hbc 26 


Nous nous limiterons à quelques démonstrations : 
CKo — (2Ko)Ko — 2Ko . Ko = 2Xo = C 

de même CC — (2K0)C — 2Ko.C — 2C 

La relation C* — C exprime le fait que R* peut être 
mis en bijection avec R. Par ailleurs, les relations C < 2C 
et 2C— CC montrent que l'ensemble des fonctions 
réelles à valeurs réelles a une puissance strictement 
supérieure à celle de R. 

La relation fondamentale À < 24 met en évidence 
l'existence d’une suite strictement croissante de cardinaux 
transfinis qui eux-mêmes succèdent aux cardinaux finis. 
Une telle suite s'écrit : 


(a) No, 2Xo, - 
Nous pouvons alors considérer le nombre cardinal Qo 
associé à la réunion d'une famille d'ensembles de cardi- 


22Xo 22279 
, 


n . 


naux No, 2Xo, 22*0, .….: Op est supérieur à tous ces car- 
dinaux, et à la suite (a) on peut faire succéder la suite : 
Q 
5Q 92*<0 
(b) Qo, 2%, 22°, 22 s 


On construit ainsi une suite transfinie, strictement 
croissante, de cardinaux (c). On démontre qu'une telle 
suite n'est pas un ensemble : 


(c) No, 2X0, 22N0, … Qo, 200, 2220, ., Qu, 201, 2201. 


L'axiome du choix permet de démontrer que tout 
cardinal transfini, ou coïncide avec un élément de (c) 
ou peut être inséré entre deux éléments de (c). 

L'hypothèse du continu, conjecturé par Cantor 
lui-même, consiste à affirmer qu'il n’y a aucun nombre 
cardinal entre No — 2Xo. 

L'hypothèse du continu généralisé assure qu'il n'y 
a aucun nombre cardinal entre a et 24. 

Une autre approche de ce problème va être exposée 
avec l'étude des nombres ordinaux. 


Nombres ordinaux 


Pour des ensembles totalement ordonnés, la notion 
d'ensembles équipotents peut être renforcée par celle 
d'ensembles isomorphes. Deux ensembles totalement 
ordonnés (M, <) et (M,, <,) sont isomorphes (ou 
semblables) s'il existe une bijection f de M sur M, 
telle que, pour tout couple (x, y) d'éléments de M 
x < y si, et seulement si, f (x) <, f (y). 

La relation ainsi définie est réflexive, symétrique et 
transitive, mais, pas plus que pour la relation d'équipo- 
tence, nous n'avons ici une relation d'équivalence. Il 
faudrait pour cela que l'ensemble de tous les ordinaux 
existât, ce qui est faux. 


De deux ensembles isomorphes on dit qu'ils ont 


même type d'ordre. On note (M, <) le type d'ordre 
de l'ensemble M ordonné par la relation <. 

Les nombres ordinaux seront ies types d'ordres des 
ensembles bien ordonnés. Un ensemble ordonné est 
par définition bien ordonné si toute partie non vide de 
cet ensemble admet un plus petit élément. 

L'ensemble N muni de la relation d'ordre usuelle 
est un ensemble bien ordonné. On désigne par w le type 
d'ordre correspondant. 

L'ensemble N muni des ordres définis par : 


est encore bien ordonné, mais les nombres ordinaux 
correspondants sont différents. 

(1) possède un plus grand élément alors que (N, <) 
n'en a pas. 

N peut être bien ordonné d'une infinité de façons 
créant une infinité de nombres ordinaux différents; 
cette propriété s'étend à tout ensemble de puissance 
supérieure à celle de N. 

Notons qu'un ensemble peut être totalement ordonné 
sans être bien ordonné (la réciproque est fausse). Il suffit 
de considérer N ordonné par : 


0<2<4<6.<7<5<3<1 


Le sous-ensemble des nombres pairs n'a pas de plus petit 
élément. 

Mais cela ne peut se produire que pour des ensembles 
infinis. Deux ensembles finis de même cardinal » et 
totalement ordonnés sont semblables. On identifiera leur 
nombre ordinal à n, indiquant ainsi que le résultat du 
dénombrement dans le cas fini est indépendant de l'ordre 
choisi pour dénombrer. Il n'en est pas de même pour 
les ensembles infinis. 


Opérations sur les ordinaux 


Nous nous limiterons à définir la somme de deux 
ordinaux. 
Étant donné deux ordinaux « et &, on considère les 


ensembles bien ordonnés (A, < 4), (B, < 8) tels que : 


<aA)=« et (B,< (B, <g) — B, ANnB= 9 

Alors x + 8 — (A Ü B, < 48) où < 48 est une rela- 
tion de bon ordre telle que x < ag y si et seulement si 
xX<AYy ou x < 8 y au lieu de xe À et yeB. Tous les 
éléments de À précèdent ceux de B. 

On démontre que «+8 est 
ensembles A et B choisis. 

L'addition des nombres ordinaux finis a les mêmes 
propriétés que l'addition des nombres finis. L'addition 
de nombres ordinaux n'est pas, en général, commutative. 

Considérons les ensembles N et N° = N — {0} 
munis de la relation d'ordre usuelle. Ils sont semblables. 
(N, <) est la réunion ordonnée des ensembles bien 
ordonnés ({0}, <) et (N°, <). Le nombre ordinal de {0} 
est 1, celui de (N, <) est w; on a donc : 1 + © = ©. 

La réunion ordonnée des ‘ensembles bien ordonnés 
(N*, <)et ({0}, <) est l'ensemble ordonné (1) ci-dessus. 
Son type d'ordre « + 1 est différent de ©. 

D'où 1 + w £ wo + 1. 

Les nombres ordinaux des ensembles (2), (3), (4) sont 
respectivement 


indépendant des 


o+1, © 2, © + o — ©. 


Comparaison d'ordinaux 


Étant donné deux ensembles bien ordonnés (A, < 4) 
et (B, < 8), le second est un segment initial du premier 
si B est un sous-ensemble de A qui, chaque fois qu'il 
contient un élément de A, contient tous ses prédécesseurs, 
l'ordre < 8 étant la restriction de < 4 à l'ensemble B. 

æ et 8 étant deux ordinaux, on dira que £ est infé- 
rieur à x, (B <o «), s’il existe des ensembles bien ordonnés 
(A, < a) et (B,<8)telsquex= (A, < (A. <a) et£ = (B,< (B,<=) 
avec (B, < 8) segment initial de (A, < A). 

Cette relation est réflexive, antisymétrique et transitive, 
mais, comme les nombres ordinaux ne forment pas un 


ensemble, on ne peut pas parler de relation d'ordre. 
Cependant on démontre que, sur tout ensemble de 
nombres ordinaux, la relation <o induit un bon ordre, 
donc un ordre total. 

Un ensemble K d'’ordinaux qui, lorsqu'il contient un 
ordinal, contient tous ses prédécesseurs pour la relation 
<o, est appelé segment initial d'ordinaux, on le note 
(K, <o). L'ensemble P (x) des ordinaux qui précèdent 
l'ordinal x pour <o est un segment initial d'ordinaux, et 
réciproquement tout segment initial d'ordinaux peut se 
mettre sous la forme P (x). La correspondance qui 
à « associe P (x) est donc une correspondance biuni- 
voque entre ordinaux et segments initiaux d'ordinaux, 
et on démontre qu’en général le type d'ordre de P (x) 
est «. On a ainsi: 


P (wo) = w 


(il suffit de vérifier que « est précédé par et seulement 
par tous les ordinaux O, 1, 2, 3, ..) 


Pr -0+1 

(«w — 1 est précédé par et seulement par O, 1, 
FD - 
P(0) = 


Étant donné un segment initial d'ordinaux, il existe un 
nombre ordinal qui domine tous les ordinaux du segment, 
c'est le type d'ordre du segment lui-même. Ajoutant un 
tel nombre ordinal au segment, on obtient un nouveau 
segment initial d'ordinaux qui contient strictement le 
premier. On réitère le procédé. On est ainsi amené à 
construire une suite transfinie strictement croissante de 
nombres ordinaux, analogue en quelque sorte à la suite 
transfinie des cardinaux du paragraphe précédent. 

On peut classer les nombres ordinaux en deux caté- 
gories : la première constituée par les ordinaux qui ont 
un antécédent immédiat dans la suite transfinie des 
ordinaux, la seconde constituée par les ordinaux qui 
n'en ont pas. À la première catégorie appartiennent les 
ordinaux finis supérieurs à O et «© + 1, © + 2..; à la 
seconde appartiennent ©, © — © — wo, … On peut repré- 
senter la suite transfinie des idéaux de la façon suivante : 


D; ven ©) 


0 1 2 roue ra) 
o — 1 o — 2 GE Dis w2 
o2 + 1 o2 + 2 @2 + 3 ..... o3 
On + 1 OneE 2 icusmemememimenre On 


A tout nombre ordinal est associé un cardinal bien 
défini, celui de tout ensemble ayant un type d'ordre égal 
au nombre ordinal. Les ensembles qui ont pour ordinaux 
©, © + 1, © + 2, …, w2 ont tous la puissance du dénom- 
brable. À tout nombre cardinal donné correspond toute 
une classe de nombres ordinaux. Nous n'approfondirons 
pas plus ici ces propriétés. 

Signalons cependant que l'on peut démontrer l'équi- 
valence entre l’axiome du choix et l'axiome de Zermelo : 
« Tout ensemble peut être bien ordonné ». 

Nous terminerons par une citation de Cantor au sujet 
des relations © + 1 = w + 1 et 1 — © = © : « Nous 
l'avons vu, c’est la position relative du fini par rapport à 
l'infini qui importe; si le fini précède il est absorbé par 
l'infini et disparaît, s’il suit l'infini il subsiste et transforme 
celui-ci en un nouvel infini différent du premier. » 


BIBLIOGRAPHIE 


BOURBAKI, Théorie des ensembles, Paris, Hermann, 
1970: Éléments d'histoire des mathématiques, Paris, 
Hermann, 1960. - BOUVIER, /a Théorie des ensembles, 
coll. « Que sais-je? », Paris, P.U.F., 1969. - BREUER, 
Initiation à la théorie des ensembles, Paris, Dunod, 
1969. - CAVAILLES, Philosophie mathématique, Paris, 
Hermann, 1962. - DESANTI, /a Philosophie silencieuse, 
Paris, Seuil, 1975. - EXBRAYAT et MAZET, A/gèbre 1, 
Paris, Hatier, 1971. - GODEMENT, Cours d'algèbre, Paris, 
Hermann, 1966. - HALMOS, /ntroduction à la théorie 
des ensembles, Paris, Gauthier-Villars, 1967. - LE LION- 
NAIS, /es Grands Courants de la pensée mathématique, 
Paris, Blanchard, 1962. 


35 


> Sur cette planche, 
tirée de l'Histoire des 


mathématiques 
de Montucla, 
divers systèmes 
de numération et 


caractères arithmétiques 
utilisés par un certain 


nombre d'auteurs 


à différentes époques. 


On remarquera 
que chez Boëèce 
il mangue encore 


une notation pour le zéro. 


» Le logicien 


et mathématicien italien, 


Guiseppe Peano 
(1858-1932); 


Anciens Caracteres Arithri cliques 
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1) 1 est un nombre naturel; 

Il) pour tout nombre naturel n, il existe un nombre 
naturel n’ unique, appelé successeur de n: 

II) 1 n'est le successeur d'aucun nombre; 

IV) deux nombres naturels différents ont deux 
successeurs différents ; 

V) une propriété vraie pour le nombre 1, et qui, 
si elle est vraie pour un nombre naturel, est 
alors vraie pour son successeur, est vraie pour 
tout entier naturel. 

L'axiome V est très important, car il fonde le raisonne- 
ment par récurrence. Ainsi, il va servir à définir par récur- 
rence l'addition : 

Le système 


{m+1—m (successeur de m) 
|m+n = (m+n) (successeur de m + n) 


(1) 


permet de définir de façon unique une opération, +, 
qui, à tout couple (m, n) d'entiers naturels, associe un 
entier naturel unique m + n, appelé somme de m et de n. 

Tout d'abord, remarquons grâce à l'axiome IV que 
(m + n)’ est unique, donc également m + n’. Soit alors 
P (n) la propriété : « m + n est défini de façon unique 
par le système (1) pour tout nombre naturel n »; P (1) 
est vraie. En outre, d'après la remarque précédente, si P (n) 


on lui doit notamment 
un exposé axiomatique 
de Ja théorie 

des nombres entiers. 


est vraie, alors P (n’) l'est aussi. L’axiome V permet d'affir- 
mer que P (n) est vraie pour tout entier naturel n, c'est- 
à-dire que m + n est défini de façon unique pour tout 


Buscaglia 


LES NOMBRES 


Les entiers naturels 


La notion de nombre entier qui nous est si familière 
n'a été élaborée que très lentement au cours de l'histoire. 
Compter, c'est-à-dire mettre en correspondance les objets 
de deux collections, est une opération qui ne nécessite 
pas l'usage de mots spécifiques. Lévy-Bruhl a remarqué 
que dans certaines sociétés primitives ces mots sont 
tout à fait ignorés sans pour autant rendre impossible 
la démarche qu'ils impliquent. 

Les mots numérateurs ne suffisent pas non plus à établir 
l'existence de nombres abstraits, ils ont été longtemps 
marqués par des valeurs magiques ou affectives dont 
il reste encore des traces de nos jours (le nombre 13). 
Avec Pythagore, les nombres se détachent de représen- 
tations réelles pour être pensés comme des arrangements 
privilégiés de points. C'est seulement au XIX® siècle, 
avec l'essor de l’axiomatique, que les mathématiciens 
s'affranchissent de toute représentation pour définir 
les nombres dits naturels. 

On doit à Peano (1858-1932) et à R. Dedekind (1831- 
1916) un exposé axiomatique de la théorie des nombres 
entiers. Nous allons montrer comment on peut déduire 
l'arithmétique élémentaire de cinq axiomes (qui sont, 
à quelques modifications secondaires près, ceux qui ont 
été formulés par Peano en 1889) : 
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couple met n. 
De même, on définira par récurrence la multiplication : 
le système : 


{m:1=m 
\m-n={(mn)+m 


(2) 


permet de définir de façon unique une opération, :, qui 
à tout couple (m, n) d'entiers naturels associe un entier 
naturel unique m + n (noté aussi mn) appelé produit de 
m et de n. La démonstration est analogue à la précédente. 

Toujours en utilisant l'axiome V, on démontre que 
l'addition et la multiplication des entiers naturels ont les 
propriétés suivantes : 


(Aa) (8a+b)+c—=a-+(b+c) 
(associativité de l'addition) 

(Ca) a+ b=b+a 
(commutativité de l'addition) 

(Am) (a-b):c—=2a.(b.c) 
(associativité de la multiplication) 

(Cm) a-b=b.3a 
(commutativité de la multiplication) 

(D1) a-(b+c)=a.b+a:.c 
(distributivité de la multiplication par rapport 
à l'addition) 

(D2) (a+b):c=a.c+b.c 


(distributivité de la multiplication par rapport 
à l'addition) 


Remarque 

Les axiomes de Peano tels que nous les avons énoncés 
définissent l’ensemble N* = {1, 2, 3, ….}; une autre ver- 
sion fait intervenir le zéro, il suffit de le substituer à 1 dans 
les axiomes (et alors 0’ — 1). Dans le système (1) 
on remplace la première égalité par m + O = m, et 
dans le système (2) par m:0 = 0. Toutes les autres 
considérations du paragraphe restent inchangées. 


Ordre sur N 


L'ensemble N = {0, 1, 2, 3, …} des entiers naturels 
est ordonné par la relation suivante : 

a < b (a est inférieur ou égal à b) ou encore b > a 
(b est supérieur ou égal à a) si, et seulement si il existe 
un nombre naturel c tel que a + c = b; cette relation 
est manifestement réflexive, antisymétrique et transitive. 
C'est une relation d'ordre total, car, pour tout couple 
(a, b), l'une ou l'autre des deux assertions a < b ou 
b > a est vraie. 

Cet ordre est compatible avec l'addition et la multi- 
plication, ce qui revient à dire : 


sia<b alors a+c<b+c et ac<bc;en 
effet a < b équivaut à b — a + d,alorsb+c—a—d+c 
= a + c+ d (d'après Aa et Ca), donca+c<b+c; 
de même, bc = (a + d) c = ac + dcet ac < bc. 


On démontre que l'équation a + x = b, pour deux 
entiers naturels quelconques a et b, admet au plus une 
solution dans N. Cette solution existe si, et seulement si 
a < b, on la note b — a, c'est la différence entre b et a’ 
et l'opération correspondante est la soustraction. 


Les entiers relatifs 


Nous venons de remarquer que la soustraction ne peut 
pas toujours être effectuée pour deux entiers quelconques. 
Pour combler cette lacune, nous allons construire un 
nouvel ensemble, noté Z, celui des entiers relatifs. 

Cette extension ne peut se faire sans précaution. Les 
opérations que l'on définira sur le nouvel ensemble doivent 
coïncider avec celles qui sont déjà connues sur N, 
considéré comme partie de Z. Nous allons montrer de 
façon rigoureuse comment construire Z à partir des 
entiers naturels. 


Le problème que nous nous proposons de résoudre est 
celui de donner un sens à a — b quels que soient les 
entiers a et b et pas seulement dans le cas où a > b. 
Nous savons déjà que la proposition suivante : 


(1) a — b — c— d'si, et seulementsia+ d=b+c 
est vraie pour a > bet c > d, c'est-à-dire quand a — b 
et c— d sont des entiers naturels. C’est cette restriction 
qu'il nous faut abolir. 
Considérons la relation suivante sur N > N : 
(a, b) — (c, d) si, et seulementsia+— d=b+c 
où la soustraction n'intervient plus. 
Cette relation est une relation d'équivalence, c'est-à- 
dire une relation 
— réflexive : (a, b) + (a, b) 
— symétrique: si (a, b) — (b,a) alors (b,a) + (a,b) 
— transitive : si (a, b) — (a’,b')et (a’,b') = (a”,b”) 
alors (a, b) = (a”, b”). 
La vérification est immédiate. 
Nous pouvons donc obtenir une partition de l'ensemble 
N x N, ensemble des couples d'entiers naturels, en 
classes d'équivalence deux à deux disjointes. 


Ainsi : (2,3) + (7,8) car 228—7+3 


(2, 3) et (7, 8) appartiennent à la même classe 
notée indifféremment [2, 3] ou [7, 8]. 
On note [a,b] la classe à laquelle appartient le 
couple (a, b) que l’on appellera représentant de la classe. 
Nous désignerons alors par Z l'ensemble des classes 
d'équivalence : 


Z = {[a, b] |2,bEN} 


Il reste à définir dans Z les opérations, somme, produit, 
qui l'ont été dans N. Pour cela, on pose 


(2) [a, b] + [c, d]= [a+ c b—+ dl] 
(3) [a, b] + [c, d] = [ac + bd, ad + bc]. 


Par convention, la multiplication l'emporte sur l'addition, 
ce qui évite l'usage excessif de parenthèses dans une 
expression du type ac + bd, par exemple. 

Les définitions (2) et (3) ne sont acceptables que si 
elles sont indépendantes des représentants cités; en 
d'autres termes, si (a’, b’) = (a, b) et (c’, d’) + (c,d) 
implique 
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La”, b°] + [c’, d'] = [a, b] 
et 
Ca”, b’] + [c’, d’] = [a, b] : [c, d] = [ac + bd, ad + bc]. 


On dira alors que les opérations considérées sont compa- 
tibles avec la relation d'équivalence. 

Vérifions la première propriété. Cela revient à montrer 
que [a’ + c’, b + d’ [a + c, b — d]. Par hypothèse, 
(a’, b") + (a, b), ce qui équivaut à a° + b — b’ + à, 
de même c’ + d = d’+ c,il en résulte 


(a + b) + (ce + d) = (b' + a) + (d’ + c), soit encore 
(a + c°) + (b d) (b° + d’) + (c + a), d'où le 
résultat. 

Nous nous sommes servi du fait que [a, b] — [c, d] si, 
etseulement si (a, b) + (c,d),c'est-à-dire,a — d=b+c:; 
cela va nous permettre de faire la remarque suivante : 

Si b > a, l'unique solution de l'équation a + x = b 
dans N est parfaitement connue et notée b— 3: on 
aura 


a + (b— a) = b = Db 
Si a> b, alors 
[a, b] = [a — b, 0]. 

Toute classe peut se mettre sous l’une ou l’autre de ces 
deux formes : [n, 0] ou [0, n]. 

Si nous considérons la bijection qui, à la classe [O, n], 
associe l'entier n, nous nous apercevons que c'est un 
isomorphisme (une bijection qui conserve les structures 
définies sur chaque ensemble); plus précisément : 

[0, n] + [0, m] = [0, mn] 
[0,n]-[0,m]=[0:m+n.0,0.0+n.m]— [0,n:m] 
cela nous permet d'identifier l'ensemble des classes de la 


[ce d]= [a+ c,b+ d] 


0 d'où [a, b] = [0, b — a]. 
a=a+0—b+(a—b) et 
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forme [0, n] avec l'ensemble N et de justifier l'égalité 
[0, n] = n (en toute rigueur, ceci est illégitime car [0, n] 
appartient à l'ensemble des classes d'équivalence de 
N %x N pour une certaine relation d'équivalence et n 


appartient à N). On posera [n,0] =— n, et alors 
Z={n,—n|neN} 


Z muni de l'addition est un groupe commutatif, c’est-à- 
dire un ensemble muni d'une loi 


— commutative : 
Ca, b] + [c, d] = [c, d] + [a, b], 
— associative : 
(Le, b] + [c, dj) + Le, f] = [a, b] + ([c, d] +[e,f]) 


ce qui rend inutile l'usage des parenthèses, 
— possédant un élément neutre : [0, 0] = O 
ainsi [a, b] + [O, 0] = [a + O0, b + O] — [a, b], 


— et telle que chaque élément [a, b] possède un 
symétrique [a’, b’] vérifiant [a, b] — [a’, b’] = [O, 0]: 
en effet, [a, b] [b, a] [a — b, b + a] [O, 0]. En 
particulier, le symétrique de [0, n] — n sera [n, 0] = — n. 

Le symétrique de tout élément est unique. 

Pour le vérifier, supposons que l'on ait : 


a+ (—a)= a+ (—8)= 0, alors (— x) + a+ (— ax) = 
(— a) + a + (— 8) d'où 0 + (— x) = 0 + (— B) et 
—ax——8$ 

sia < b [a, b] = [0, b— a] = b— 3; 

sia > b[a, b] — [a— b,0] = — (a—b); 

or [a — b, 0] + [b— a, 0] = [O, 0]. 


Le symétrique de a — b est donc b — a, et dans tous 
les cas on a [a, b] — b— a. 

Nous sommes maintenant en mesure d'affirmer que 
l'équation a — x — b admet une solution unique dans Z, 
quels que soient a et b, à savoir x — b— a. 

Il nous reste à examiner les propriétés de la multipli- 
cation dans Z. Elle est 


— commutative : [a, b] + [c, d] = [c, d]: [a, b], 
— associative : 


(Le, b]-[c, d]) -[e,f] = [a, b]: ([c, d]-[e,f]); 
en outre 


La, b] + ([c, d] — Le, f]) = [a, b] : [c, d] + [a, b] :[e,f] 


ce que l'on traduit en disant que la multiplication est 
distributive par rapport à l'addition. Les démonstrations 
se font en se reportant aux définitions des opérations sur 
les classes données plus haut. 

Z muni de ces deux lois est un anneau commutatif. 

De façon générale (cf. Structures), on appelle anneau 
le triplet (A, +, -) où A est un ensemble sur lequel on a 
défini deux opérations + et :, c'est-à-dire deux appli- 
cations de À X À — A possédant les propriétés suivantes: 

— (A, —) est un groupe abélien (commutatif) : 

— la multiplication est associative; 

— la multiplication est distributive à droite et à 
gauche par rapport à l'addition. 

Sila multiplication est commutative, on dit que l'anneau 
est commutatif. Z en est un des exemples les plus impor- 
tants. 

On démontre que Z est le plus petit anneau contenant N 
dans lequel l'équation a + x — b admet toujours une 
solution. 


Propriétés des nombres entiers 


L'ordre 


Parmi d'autres propriétés remarquables, Z possède celle 
d'être un ensemble totalement ordonné (étant donné 
deux éléments quelconques a et b de Z, on a toujours 
a<boub< a). | 

Nous allons montrer comment l'ordre total obtenu 
sur N induit un ordre total sur Z respectant la structure 
d'anneau. 

Un anneau À ordonné est un anneau sur lequel est 
définie une structure d'ordre total compatible avec les 
lois de l'anneau, c'est-à-dire vérifiant : 


(01) Deux éléments quelconques a et b sont comparables 


Ya EA, VbEeA a<boub<a 
(02) VceA (a<bæa—c<b-—c) 
(03) a<b, c>0—ac< bc 
Dans un anneau ordonné, on a l'équivalence 
(1) a<b<b—a>x 0. 


Ce qui nous permettra de reformuler la définition d'un 
anneau ordonné sous une autre forme équivalente qui se 
révélera utile. 

Un anneau ordonné est un anneau pour lequel on peut 
déterminer un sous-ensemble P, que l’on appellera sous- 
ensemble des éléments positifs, (x> 0<xeP),tel que: 


(01’) pour tout élément a de A*— A— {0} une, et 
une seule, des relations a > 0, — a > O est vraie; 
(02') a>0,b>0—=a+b>0; 

(03') a>0,b>0— ab >. 


Supposons À ordonné selon la première définition. 
Comme l'ordre est total pour tout élément a, a > 0 
ou a < O:sia < O alors a + (— a) < — a d'après (02), 
donc 0 < — a et (01’) est vrai. Sia>0,b<a—b 
d'après (02), comme b > O0 la transitivité de la rela- 
tion d'ordre implique a + b > 0, donc (02) est vraie. 
(03) est une conséquence immédiate de (03). 

Réciproquement supposons À ordonné selon la seconde 
définition. On vérifie immédiatement que la relation a < b 
si, et seulement si a — b > O est une relation d'ordre 
total. (02) se déduit immédiatement de la définition de 
l'ordre. Enfin, de a < b,c > 0, on déduit b—a > O, 
d'où bc — ac > O (d'après 03’) et ac < bc. Il y a bien 
équivalence entre les deux définitions. 

C'est la deuxième définition qui nous servira : N consi- 
déré comme partie de Z a bien les propriétés requises et 
permet donc de faire de Z un anneau ordonné. 

La divisibilité 

Un des problèmes fondamentaux dans N comme dans Z 
est celui de la résolution de l'équation ax = b et plus 
généralement celui de l'étude des propriétés de divisi- 
bilité dans ces ensembles. 

Faisons d'abord quelques remarques : 

— il existe dans Z un élément neutre pour la multi- 
plication, le nombre 1 tel que a1 = 1a — 1; 

— la multiplication dans Z est une opération régu- 
lière : ac = bc, c Æ 0 —= a = b, 
ce qui équivaut à la proposition suivante : 


ab=0—a—0 ou b= 0. 


Comme on le voit en remarquant que ac = bc, 
c£0,<(a—b)c— 0, c%# 0. La première propriété 
exprime que Z est un anneau unitaire, la deuxième que 
c'est un anneau intègre. 

Si b est un entier quelconque, tout entier a pour lequel 
l'équation ax — b admet une solution entière est appelé 
diviseur de b. Par la suite, nous emploierons indifférem- 
ment les expressions a est un diviseur de b, b est divisible 
par a, b est un multiple de a, que nous noterons a | b. 

Ainsi, pour tout entier a, a | 0. Par contre 0 | b si, et 
seulement si b — 0. L'équation Ox — b a une infinité 
de solutions si b — 0, aucune solution si b 0. L'équa- 
tion ax — b a une solution unique si a # O0 (ceci résulte 


de la régularité de la multiplication), solution notée = 
b.; 7. 
: n'est donc définie que pour a # O. 


Tout entier a possède quatre diviseurs triviaux 1, — 1, a, 
— a. D'ailleurs, si a est un diviseur de b, c'est-à-dire s'il 
existe un entier x tel que b = a: x, alors b = (—a) (— x), 
ce qui montre que — a est un diviseur de b. Dans la théorie 
de la division, il n‘y a pas lieu de faire une distinction 
entre deux nombres opposés, et nous ne considérerons 
que les positifs. 

Étudions dans N la relation a | b. Elle est réflexive, 
antisymétrique (a |b et b|a<a— b) et transitive 
(ab, bIc—al|c); c'est donc une relation d'ordre. 
On dira que a  b (a est antérieur à b) si, et seulement si 
a divise b. Contrairement à la relation d'ordre usuelle 
dans N qui est une relation d'ordre total (a et b sont 
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toujours comparables), cette deuxième relation d'ordre 
est une relation d'ordre partiel : 2 12, car 12 est un 
multiple de 2 mais 2 et 5 ne sont pas comparables. Étant 
donné deux entiers a et b, le plus petit entier postérieur 
à a et b au sens de la relation << est appelé p/us petit 
commun multiple (ppcm) de a et b; le plus grand entier 
antérieur à a et b au sens de la relation < est le p/us grand 
commun diviseur (pgcd) de a et b. L'ensemble N ainsi 
ordonné est un treillis (cf. Structures). 

La détermination du pgcd de deux nombres a et b peut 
se faire grâce à un procédé dû à Euclide et connu sous 
le nom d'a/gorithme d'Euclide. 

Étant donné deux entiers a et b, il existe toujours un 
entier g (quotient) et un entier 7 (reste) tels que : 

a=bq-7r 0<r<b division euclidienne 
(il suffit de choisir pour g le plus grand entier tel que 
bq < a et de prendre r = a — bq) 

g et r sont déterminés de façon unique. 

Supposons que x soit un diviseur de a et de b (a > b), 
x divise r, « est donc un diviseur commun de r et de b, 
le pgcd de a et b est donc le même que celui de betr; 
on réitère le procédé jusqu'à ce que l'on trouve un reste 
nul, l’avant-dernier reste est alors le pgcd. Appliquons 
cet algorithme à la recherche du pgcd de 336 et 144; 

336 — 144 (2) — 48 
144 = 48 (3) — 0 
le pgcd de 336 et 144 est 48. 

On vérifie sans peine que tous les diviseurs communs 
de 336 et 144 sont exactement ceux de 48. 

Deux entiers a et b sont premiers entre eux si, et seule- 
ment si leur pgcd est 1. 

Si on multiplie ou divise deux nombres par m, leur pgcd 
est multiplié ou divisé par m. Par conséquent, en divisant 
deux nombres par leur pgcd, on obtient deux nombres 
premiers entre eux. 
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A Une division 
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La propriété suivante est un des théorèmes fondamen- 
taux de la théorie de la divisibilité : si un entier K divise le 
produit ab et si & est premier avec a, alors K divise b. 

Pour le démontrer, supposons a, b, k non nuls. Par 
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jerhez jes pe yes 6 17 196 198 joofior Jyo2f1s3] 15€ 195 ve 
pélis7] 1»4[195]206 zat 202 206 206 206 206 pui 206 20620 À AR SU AL 
OÙ D1, …, Dr Sont des nombres premiers vérifiant 
Pu]gE 26 76 6 pi on 6 26 6 A genes À un à 
et é1, …, t des exposants entiers. 


Cette décomposition est appelée décomposition 
canonique. 


Palais de la Découverte, Paris 


40 


Supposons qu'il existe deux décompositions de a en 
facteurs premiers et groupons au début de chaque décom- 
position les éléments communs aux deux en un produit A. 

Alors a — AP = AO implique P = Q. Soit alors p un 
des facteurs premiers intervenant dans le produit P, 
p est premier avec chacun des facteurs de Q (d'après la 
définition même de A), mais p divise Q (puisque p 
divise P), il y a donc contradiction, et l'hypothèse de 
l'existence de deux décompositions est fausse. 

La décomposition canonique s'obtient en cherchant 
les facteurs premiers dans l'ordre croissant comme sur 
l'exemple suivant : 


n = 10 800 10 800 | 
5 400 
2 700 
1 350 

675 
225 
75 
25 
5 

1 


O1 O1 © WW ND ND ND ND 


10 800 — 24: 33: 52. 


Ceci va nous permettre de déterminer rapidement le 
pgcd ou le ppcm de deux nombres a et b, connaissant leur 
décomposition canonique. Soit p1, …, Pr tous les facteurs 
premiers intervenant dans les deux décompositions (éven- 
tuellement sous la forme p; = 1) avec les ordres de 
multiplicité (exposants) f1, …, {; POUr à, U1, …, Ur Pour pr 
si on désigne par m, le plus petit des deux nombres ti et 
u; et par M; le plus grand, alors : 


pgcd (a, b) = pf:.p3®.… prr 
ppem (a, b) = pin . pète … pitr 


La répartition des nombres premiers est un problème 
posé dès l'Antiquité grecque et qui reste encore ouvert. 
Euclide, déjà, a montré l'existence d'une infinité de 
nombres premiers grâce à l'argument suivant : soit Ps, 
p2, …, px, k nombres premiers ; alors n = (p1 .p2.…. px) + 1 
est premier avec p1 po … px, Car si un nombre divisait 
à la fois le produit p1 .p2 … px et n, il devrait diviser 1. 

D'autre part, n admet au moins un facteur premier, ce 
facteur est nécessairement distinct des p1, …, px: il existe 
donc un nombre premier distinct des & nombres premiers 
considérés. 

La distribution des nombres premiers dans l'ordre crois- 
sant des entiers est extrêmement irrégulière, et a fait 
l’objet de recherches nombreuses et très approfondies. 
Si l'on désigne par n!! le produit des nombres premiers 
inférieurs ou égaux à n : 211=2, 311l=411—6, 


5ll = 611 — 30,711 — 811 — 911 = 101! = 210 

1111=1211= 2310,1311 = 1411 = 1511 = 161! — 

30 030, etc. 

alors nl! + 1 peut être premier ou non mais 
nlU+2,..nll=n 


sont tous des nombres composés (non premiers). 

Par suite, on peut trouver dans la liste des nombres 
premiers des trous de longueur arbitraire, par exemple 
deux nombres premiers consécutifs dont la différence est 
au moins égale à 100, il suffit de remarquer que 10111 -+ 2, 
… 1011! + 101 est suite de 100 nombres composés. 
Mais on peut aussi rencontrer plusieurs nombres pre- 
miers très proches, par exemple 101, 103, 107, 109. 
Cependant, les nombres premiers se raréfient à mesure 
qu'ils deviennent de plus en plus grands. 

On démontre que, si l'on désigne par 7 (7) le nombre 
de nombres premiers inférieurs ou égaux à n, on a la 
relation : 


s n É . 
lim F6. 0 (plus précisément 7 (7) tend vers “ ) 
tou Hi Logn, 


D'autre part, les nombres premiers se raréfient plus 
lentement que les carrés des nombres entiers; la série 


Le] œo : 
1 Fr 1 | 
> mc) est convergente alors que la série 4 — des inver- 


n=1l ñ=1Pr 


ses des nombres premiers ordonnés en une suite crois- 
sante P1, …, Dn, … est divergente. 


Ne s 
BEA LEAVE ANNEE EH TURF LE (Il TELE LE LL LL 


L'hypothèse de Fermat 


Pierre de Fermat (1601-1665), conseiller au Parlement 
de Toulouse, est célèbre pour ses nombreuses découvertes 
en arithmétique. Reprenant un problème posé par Dio- 
phante d'Alexandrie au IVe siècle : trouver tous les triangles 
rectangles dont les trois côtés sont mesurés par des nom- 
bres entiers, c’est-à-dire, résoudre dans N l'équation : 


X2+y2= 72 
dont la solution est donnée par 
a2 = p? a? — p? 
WE 
2 2 
Fermat déclare avoir découvert une méthode remarquable 
prouvant que l'équation : 


y = ab, 


XR L yn = 7n 


n’a aucune solution en nombres entiers pour 7 supérieur 
à 2. Malheureusement, il ne laissa pas de trace de sa 
démonstration. Des travaux ultérieurs, dus en particulier 
à Kummer au XIX® siècle, montrèrent que l'hypothèse de 
Fermat est exacte pour de nombreuses valeurs de n, 
mais la démonstration complète n’en a pas encore été 
élaborée. 
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A Le mathématicien 


Pierre de Fermat 
(1601-1665) célèbre pour 
ses nombreuses 
découvertes en 
arithmétique. Ses 
principaux écrits ont été 
publiés par son fils, en 
1679, sous le titre de 
Varia Opera 
mathematica. 


o 
= 
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> 
h = 
e] 
© 
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Lo 
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» Figure arithmétique 
extraite des Œuvres 
de Newton (édition du 
XIXe siècle). 


Page ci-contre, 
document ancien 
extrait d'un ouvrage 
maghrébin et utilisant 
dans un « dessin 
magique » des 
symboles numériques 
{musée du Caire). 


Snark International 


Les nombres rationnels 


De même que l'équation a + x = b n'a pas toujours de 
solution dans N, l'équation ax — b n'a pas de solution 
dans N, ni dans Z pour toutes les valeurs du couple (a, b). 
Cela va nous amener à définir un nouvel ensemble de 
nombres, Q, ensemble des nombres rationnels, dans 
lequel l'équation ax = b peut être résolue pour tout 
a (Æ 0) et tout b. 

Nous construirons cet ensemble ( par un procédé 
analogue à celui que nous avons utilisé pour Z. La relation 
que nous allons considérer dans Z xX Z* (Z* — Z —{0}) 
est la suivante : 

(a, b) = (c, d) si, et seulement si ad = bc. 


On vérifie sans peine que cette relation est une relation 
d'équivalence, ce qui permet d'obtenir une partition de 
Z X Z* en classes d'équivalence deux à deux disjointes. 


ns a : : 
Nous désignerons par : la classe à laquelle appartient le 


couple (a, b) et par Q l'ensemble des classes d'équi- 
valence : 


a 
Gel aeZ,bez*\ 
|b ] 
Il reste encore à définir sur Q une addition et une multi- 
plication qui prolongent celles que l'on connaît dans 7; 
pour cela nous poserons : 


a c _ad-+ bc 
bd bd 
a c _ ac 
bd bd 


ce qui, a priori, a un sens puisque bd Æ 0 (la classe Fn'est 
définie que pour b # O). 


42 
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er100:0000500000D2:BO606D@. 000098 e.1s0.°- 


Considérons dans Q le sous-ensemble des classes de la 


[a | 
forme | 7 2€! 


en effet l'application + qui, à l'élément a de Z associe la 


: ce sous-ensemble est isomorphe à 7; 


a ur : na 
classe T est bijective (elle est manifestement surjective, 


et sis ms . alors (a, 1) æ (b, 1), d'où a — b, ce qui 
prouve qu'elle est injective) et vérifie : 


= + T6 (a) + 8 () 


o (a 


b) 


UD = AP £. 


= (a+ + (6). 


s : étés a ’ : cd 
Par suite, on identifiera ï et a (comme on l'avait fait 


pour [0, n] et n), ce qui permettra de considérer Z comme 
un sous-ensemble de Q. 

@ possède toutes les propriétés de Z; comme Z, 
Q est un anneau commutatif, unitaire, intègre (c £# O, 
ac = bc = a — b), mais en outre dans Q l'équation 
ax — b admet une solution unique pour tout couple 


(a, b) (a Æ 0). 


a x b 
En effet, posons a L x £ b 1 
a2 X2 be 
(a1  O car a Æ 0; b2 5 0), alors ax — b équivaut à 
& x b se 
1 ou encore (a1 b2) x1 = (a2 b1) x2 par définition 
a2x2  b2 k 
ps ip : , ; x a2 b 
de l'égalité entre deux rationnels; il en résulte = GERS 
X2 a1b2 


la solution existe (a1 b2 0); elle est unique, on la 
’ b 
désigne par Fi 


L'ensemble Q* — @ — {0} des nombres rationnels 
non nuls est un groupe commutatif pour la multiplication. 
Il suffit de vérifier que tout rationnel + non nul admet un 
symétrique tel que xx’ = xx = 1, ce qui est une consé- 
quence immédiate de la résolution dans l'équation 


1 
ax = b. On aura & = — 
LA 


On en déduit de façon immédiate la régularité de la 
multiplication dans Q. Supposons % x — y, 2 Z O;alors 


NO EL (x y) et x = y. 
œ & 


Un anneau commutatif qui est aussi un groupe pour la 
multiplication est un corps (cf. Structures). Si la deuxième 
loi est commutative, le corps est commutatif. 

Ainsi @ est un corps commutatif. C'est le plus petit 
des corps commutatifs contenant Z dans lequel l'équation 
ax = b a une solution pour tout a ( 0) et tout b appar- 
tenant à Z. 

Nous allons maintenant montrer comment s'étend à Q 
l'ordre naturel de Z. 

a 
b 
et seulement si ab > O et pour deux nombres rationnels 
quelconques *, 8, « < 8 si, et seulement six —£$ > 0. 

Alors les propriétés (01’), (02°), (03°) du paragraphe 
précédent sont vérifiées. 

On montre aisément que ces conditions sont équiva- 


Pour tout couple d'entiers a, b avec b # 0,- > O si, 


a ; ; 
lentes à B > Osi,et seulement si ab > 0 (ae Q,beQ*). 


L'ordre ainsi défini dans Q prolonge l'ordre obtenu dans Z. 
Le corps Q satisfait à la propriété suivante : « Pour tout 
couple (a, b) de nombres rationnels strictement positifs, 
il existe un entier n tel que b > na. » Propriété que l'on 
traduit en disant que Q est un corps archimédien. 
Combien y a-t-il d'éléments dans Q ? Nous allons voir 
qu'il y en a exactement autant que dans N, résultat qui 
peut paraître paradoxal si l'on oublie que N, comme Q, 
n'est pas un ensemble fini. L'application de Q dans 


472 ; & 
N x N* qui à Ë associe le couple (a, b) est manifes- 


tement bijective, donc Card Q = Card (N x N°). 
Les éléments de N x N° peuvent être rangés de la 
façon suivante : 
(0.11 (ED (0. 4 + 00, da 
# À # 


17 42) 43) (14 
Le 4 7 ù 
2,1 (22) (23) (2,4). 
% 7 / 

/ 


1” (2) (83) (84. 
D" & # 


ù EN f 
(4,1) (4,2) (4, 3) … 
Il est possible de les numéroter en suivant les flèches 
(procédé diagonal) ; on déduit que 
Card N x N° = Card N, 
d'où le résultat annoncé : Card Q — Card N, ce qui 


s'énonce encore : 
Q est dénombrable. 


Les nombres réels 


Soit 2 le nombre dont le carré est égal à 2. Nous allons 
montrer que y2 ne peut pas être rationnel. En effet, sup- 


posons qu'il existe un nombre rationnel Sravecp etgpre- 


o 
miers entre eux, tel que = +2, alors 2 = ee et p? = 2 q?. 


2 divise 2 qg?, donc 2 divise p? et 2 divise p (il suffit 
de considérer la décomposition de p en facteurs pre- 
miers) : si 2 divise p, 4 divise p? donc 2 g?; donc 2 divise q? 
ce qui contredit que p et qg soient premiers entre eux 
puisque 2 divise également p?; l'hypothèse V2 rationnel 


My das né die ag luél ol 
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À Correspondance 
biunivoque de 
l'ensemble ] 0,1 [ avec 
l’ensemble R 

des nombres réels. 


est donc illégitime. Nous venons ainsi de mettre en 
évidence la nécessité de construire un ensemble plus 
vaste que Q, permettant notamment de résoudre des 
équations du type x? — 2. Cet ensemble sera l’ensemble 
des nombres réels R. 

L'ensemble R a pour caractéristique essentielle d’être 
un corps continu. 

Un corps ordonné K est dit continu s'il satisfait à la 
condition suivante, appelée postulat de continuité de 
Dedekind : 

Étant donné une partition des éléments de K en deux 
classes non vides et séparées, c'est-à-dire telles que tout 
élément de la première classe soit inférieur (au sens de 
l'ordre de K) à tout élément de la seconde, il existe dans K 
un et un seul élément séparateur (coupure) des deux 
classes (ce qui revient à dire un, et un seul, élément s tel 
que tout élément de la première classe ne soit pas supé- 
rieur à s, et que tout élément de la seconde ne soit pas 
inférieur à s). 

Une des méthodes de construction des réels consiste 
à considérer l'ensemble formé de : 

1) tous les nombres rationnels; 

2) toutes les partitions de l'ensemble Q des 
nombres rationnels en classes non vides et séparées dont 
la coupure n'appartient pas à Q. 

On identifie un nombre rationnel quelconque «x 
à la partition de Q en deux classes non vides et séparées 
par «, précisant que x appartient à la seconde classe. 
Alors il est aisé de définir sur R une addition, une multi- 
plication et une relation d'ordre. 

Nous nous limiterons à montrer comment on définit 
l'addition. 

Soit À et B deux partitions de Q en deux classes non 
vides et séparées (A1, A2) et (B1, B2). Par À — B nous 
désignerons la partition de Q qui admet comme pre- 
mière classe l’ensemble des nombres rationnels de la 
forme a1 + b1, où 41 appartient à A1 et b1 appartient à Bx, 
et comme seconde classe tous les autres nombres ration- 
nels. 

Le nombre réel A — B ainsi défini est appelé somme des 
nombres réels À et B. On démontrerait sans peine que 
toutes les propriétés de l'addition dans Q@ sont encore 
vraies dans R. 

Le même procédé nous permettra de définir le produit 
AB de deux nombres réels et d'étendre à R l'ordre défini 
sur R, faisant de R un corps continu, extension ordonnée 
du corps des rationnels Q. 

Si nous reprenons l'exemple cité plus haut, on définira 


V2 à l’aide de la partition de Q en deux classes non vides 
et séparées : celle des rationnels dont le carré est infé- 
rieur ou égal à 2, celle des rationnels dont le carré est 
supérieur ou égal à 2. Il existe dans R un et un seul 


élément qui sépare ces deux classes; on le note V2. 

L'ensemble R des nombres réels n'est pas dénombrable. 
R peut être mis en correspondance biunivoque avec 
l'intervalle 10,1[={x]x€R, 0 < x < 1}, comme l'illustre 
la figure ci-dessous; il suffit donc de démontrer que ]0, 1[ 
n'est pas dénombrable. 


1.G.D.A. 


‘Tout nombre réel de l'intervalle ]0, 1[ admet une repré- 
sentation décimale unique x — O, x1 X2 …, Xn …, où 
X1, X2, …, Xn, … SONt des entiers non tous nuls et non tous 
égaux à 9 à partir d'un certain rang. Réciproquement, 
tout développement décimal de ce type représente un 
élément bien déterminé de ]0, 1[. Il sera suffisant, pour 
notre propos, de montrer que l’ensemble de ces dévelop- 
pements décimaux n'est pas dénombrable. Nous le 
démontrerons par l'absurde à l'aide du procédé diagonal 
de Cantor. 

Supposons que l’ensemble des développements déci- 
maux des nombres réels de l'intervalle 10, 1 [ soit dénom- 
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brable ; alors on peut tous les numéroter par l'intermédiaire 
d'une suite 21, 82, …, an, de nombres compris entre 0 et 1; 
81, …, an, …, admettent des développements décimaux: 


a1 — O, 411 412 .… &in … 
a2 — O, 491 429 … &2n … 


Le développement décimal infini b = ©, b1 b2 … bn …, 
défini pour tout n, par bn # 0, bn Æ 9, bn Æ Ann 
(par exemple br — 2 si ann — 1, Dn = 1 Si ann £ 1) 
est du type considéré; il devrait appartenir à la suite 
&1, 42, …, an, …, Ce qui est absurde, car b diffère de a1 
pour le premier chiffre après la virgule, de a2 pour le 
second chiffre, de a, pour le n-ième chiffre. 

L'hypothèse faite est donc fausse, et on peut affirmer 
que R n'est pas dénombrable. 

Comme © est dénombrable, il existe une infinité non 
dénombrable d'irrationnels; en effet si R—@ était 
dénombrable, R le serait. 


Les nombres algébriques 


Parmi les nombres irrationnels, on considère un sous- 
ensemble, celui des nombres algébriques réels : on 
appelle ainsi tout nombre réel a qui est racine d'un poly- 
nôme 

P (X) = an X2 + an-1 X2 1 +... + a1X + & 
dont les coefficients sont des entiers de signes quel- 
conques. 


Ainsi 2 qui est racine du polynôme X2 — 2 est un 
nombre algébrique. Tout nombre rationnel Ÿ (g Æ 0)est 


un nombre algébrique, Ê est racine de gX — p = 0. 
Siar — 1,a estun entier algébrique réel. Tout nombre 
algébrique est le quotient d'un entier algébrique réel 


: ' , x 
par un entier. Pour le constater, il suffit de poser X — + 
ñn 

et de multiplier le polynôme P par (4:)* —1, alors 


P (x) = x + an-1 XL + an: an-2: X" 2 + a» + 40 


L'ensemble des nombres réels algébriques est dénom- 
brable, comme le montre le raisonnement suivant : 

On remarque que tout nombre algébrique a est 
racine d’un polynôme P (X) et d’un seul vérifiant : les 
coefficients de P (X) sont des entiers rationnels pre- 
miers entre eux dans leur ensemble (sinon on divise tous 
les coefficients par leur pgcd), P (X) est irréductible dans 
Z (si P admet une racine entière «, d'ordre n, on considère 
le polynôme P’ obtenu en simplifiant P par (X — x)?). 
Appelons degré de a le degré de P (X), et hauteur de a 
le maximum des valeurs absolues des coefficients de 
PF: (X): 

Pour d, h entiers positifs fixés, Ex, 4 désigne l'ensemble 
des entiers algébriques de degré d et de hauteur h. 
Er, a est manifestement un ensemble fini. D'autre part, 
comme l'ensemble N x N est dénombrable, alors la 
réunion des ensembles Ex, 4 pour toutes les valeurs pos- 
sibles de h et de d'est dénombrable, donc aussi l'ensemble 
des nombres réels algébriques. 

Il existe donc dans R des nombres qui ne sont pas 
algébriques : ce sont les nombres transcendants. 


Les nombres transcendants 


Liouville donna en 1851 un procédé de construction de 
nombres transcendants : 
soit a un nombre réel tel que, pour tout entier n, il 


existe une infinité de fractions irréductibles pour les- 


| 1 
quelles | a mË É 
| g ! q 
On démontre assez facilement qu'un tel nombre est 
transcendant, et on peut construire des nombres a satis- 
faisant à une telle condition en prenant des sommes de 
séries très rapidement convergentes à termes rationnels, 
par exemple : 
e- 2. ( 
n=1 2 


ñ 


Le problème de savoir si un nombre donné est ou non 
transcendant est souvent fort difficile à résoudre et fait 
appel à des résultats assez élaborés d'analyse. 

Hermite (1822-1901) a démontré que e = 2,718... base 
des logarithmes népériens, est un nombre transcendant. 
Plus tard, Lindemann (1852-1939) a établi la transcen- 
dance de rx = 3,141 59... 

Les méthodes actuellement employées sont liées à 
l'approximation, par des nombres rationnels, des nom- 
bres dont on cherche à démontrer la transcendance. Mais 
jusqu'à présent, on n'a pas pu établir la transcendance ou 
l'irrationalité de la constante d'Euler : 


C= lim (1 posté 1 Logn) 
n> 0 2 n 
définie par des séries qui convergent très lentement. 
L'approximation des irrationnels par les rationnels est 
d'un grand intérêt; c'est l'objet principal de la théorie des 
approximations diophantiennes (du nom de Diophante 
d'Alexandrie, mathématicien du IVe siècle). Dans le cas 
d'un seul irrationnel, les fractions continuées jouent un 
rôle essentiel (leurs propriétés servirent à Huyghens, 
dès 1650, pour le calcul des engrenages des horloges 
astronomiques), mais les résultats déterminants pour 
cette théorie furent établis par Liouville en 1884 et par 
Roth en 1955. 


Les nombres complexes 


Dès le XVIe siècle, les algébristes italiens Tartaglia 
(1506-1559), Cardan (1501-1576) et Ferrari (1522- 
1565) eurent l'idée audacieuse de désigner par le sym- 


bole 4— 1 la racine carrée apparemment inexistante de 
— 1. 

Ils purent alors résoudre non seulement les équations 
du 2° degré, mais aussi celles du 3° et même du 4. 
Malgré les travaux importants de D'Alembert, puis de 
Gauss, il faudra attendre le XVIIIe siècle et les publica- 
tions d'Euler pour voir disparaître chez les mathématiciens 
toute méfiance à l'égard des nombres « imaginaires ». 

L'impossibilité de résoudre dans R l'équation x? + 1 — 0 
suggère l'idée de créer un ensemble de nombres plus 
vaste. Cependant, dans un premier temps, cela peut 
paraître impossible, car jamais dans un corps ordonné 
on ne pourra extraire la racine carrée d'un nombre négatif. 
Extraire la racine carrée d’un tel nombre — a équivaut en 
fait à trouver une racine du polynôme x? + a qui est 
strictement positif comme somme d'un nombre positif a 
et d'une quantité non négative x?. | 

La racine carrée d'un nombre négatif ne pourra appar- 
tenir à aucun corps ordonné qui soit une extension de R. 

On démontre même plus : aucun corps ordonné, cons- 
truit comme une extension ordonnée de R, ne possède de 
racine d'un polynôme réel (à coefficients dans R), 
irréductible dans R. 

L'adjonction à R d'une racine carrée d'un nombre réel 
négatif, ou plus généralement d'une racine d'un poly- 
nôme réel irréductible dans R, pourra être faite à condi- 
tion de renoncer à l'ordre. Le nouvel ensemble ainsi 
obtenu ne pourra être totalement ordonné. 

Une des extensions les plus importantes de ce type va 
être le corps des complexes, obtenu par adjonction à R 
d'une racine du polynôme x? + 1. 

Divers procédés permettent de construire le corps des 
complexes; nous en décrirons un des plus simples. 
Comme le calcul complexe opère sur des expressions du 
type a — bi où a et b sont des nombres réels et / une racine 
du polynôme x? + 1, nous définirons sur l'ensemble C 
des couples de nombres réels (a, b) l'addition et la 
multiplication suivantes : 


(1) (a, b) + (c,d)=(a+b,c-+ d) 
(2) (a, b) (c, d) — (ac — bd, ad — bc) 
C’ muni de ces deux opérations est un corps. 
Nous nous limiterons à déterminer le symétrique par 


rapport à la multiplication de tout couple (a, b) différent 
de (0, 0), élément neutre pour l'addition; ce sera : 


car 


| ae? b? =:9b ab 
RTE re sn en 


où (1, 0) est l'élément neutre de la multiplication. 

La correspondance qui associe à tout élément a de R 
le couple (a, 0) est un isomorphisme de R dans le sous- 
ensemble de C’ formé par les couples (a, 0). Cette corres- 
pondance est en effet manifestement bijective et telle 
que 


(a, 0) + (b, 0) = (a — b, 0) 
(a, O0) (b, 0) = (ab, 0) 
compte tenu des identités (1) et (2) précédentes. 

Si on identifie alors le couple (a, 0) de C’ et l'élément a 
de R, ce qui peut se faire tout en respectant l'addition 
et la multiplication dans €’, on obtient le corps C, 
extension du corps R. 

Tout élément de C peut se mettre sous la forme 
a — bi où i — (0,1). C'est une conséquence immédiate 
de l'identité : 

(a, b) — (a, 0j : (1,0) + (b, 0) (0,1) 
Dans C, on aura les égalités suivantes : 
a—bi—c+<d=a-—c (b — d)i 
(a + bi): (c— di) — ac— bd + (ad + bc)i 
(a+ bi) (a—bi)=a&+b?  (i(—i)=1) 


De la dernière égalité, il résulte /? — — 1, ce qui n'est 
pas surprenant, car / (comme aussi —/) a été choisi 
comme racine du polynôme x? + 1 = 0. 

Les règles de calcul sur les nombres complexes 
z = a — jib sont les mêmes que celles que l’on connaît 
dans R, compte tenu du fait que l’on pourra remplacer 
i2? par — 1 dès que cette quantité apparaîtra, ce qui rend 
le calcul dans C très opérationnel. 

Si un corps C” contient une racine / du polynôme 
x2 + 1, alors l’ensemble des nombres a + bj constitue 
un sous-corps de C” isomorphe à C. C'est le plus petit 
sur-corps de R dans lequel x? + 1 est réductible. 

En construisant € comme une extension algébrique 
de R dans laquelle le polynôme x? + 1 admet une racine, 
on obtient un résultat beaucoup plus fort, connu sous le 
nom de théorème de D'Alembert :« Dans C tout polynôme 
non constant admet au moins une racine. » 

Il en résulte que tout polynôme de degré n peut se 
décomposer dans € en produit de n facteurs du premier 
degré. On traduit cette propriété en disant que C est 
algébriquement clos. 

En particulier, tout nombre complexe a n racines 
n-ièmes; en effet, à tout nombre complexe « on peut 
associer » nombres complexes x tels que x? = «. 

La représentation géométrique des nombres complexes 
va être la source de nombreuses applications, notamment 
pour les transformations géométriques et la trigonométrie 
(schéma ci-dessous). 


Richard Colin 
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<« On appelle affixe 

du nombre complexe 
z=a +ib /e point M 

de coordonnées (a, b) 
dans un repère 
orthonormé; alors 
z=atib=? 

(cos 8 +isin 8) = p * ei 
(pour cette dernière 
égalité, se reporter au 
chapitre Trigonométrie). 


» Page ci-contre, 
un ruban perforé 
pour ordinateur. 

Les caractères numériques 
sont représentés 
dans le système binaire. 


V Figuration du nombre, 
nombres figurés 

et calcul concret : 
exemples de figurations 
digitales numériques 
extraits de Sümma, 
œuvre de Pacioli, 

Venise, 1494. 


Palais de la Découverte, Paris 


Les quaternions 


On généralise les nombres complexes en nombres 
hypercomplexes de la forme : 


a = bo€eo + … + bn-1En-1 


où les b sont des nombres réels, les e des nombres com- 
plexes, appelés unités du système considéré et vérifiant : 
n—1 
ej Ex — Fa VYiks €s. 
s=0 
On obtient divers systèmes suivant les valeurs que 
l'on donne aux yjxs. 
Les nombres complexes ordinaires sont d'ordre 2 et 
vérifient : 
€1€1 = — €0 


€0€0 — €0,  €0€1 — €1€0 — E1, 


(eo = 1, ei =) 
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Le plus célèbre des systèmes d'ordre 4 est celui des 
quaternions, dû à Hamilton et vérifiant : 


€jej — — €0 €jer = + Eh 


CKxe; — — Ex 


où j, h,k est une permutation circulaire des nombres 1, 2,3. 


Systèmes de numération 


Les entiers 


Toutes les constructions que nous venons de décrire ne 
dépendaient pas de la manière de représenter les nombres 
naturels, entiers, rationnels, réels. Cependant, cette repré- 
sentation a une grande importance dans tous les pro- 
blèmes d'arithmétique appliquée, que ce soit dans la vie 
quotidienne où dans la recherche scientifique et tech- 
nique. 

Le système actuel de représentation décimale des 
nombres ou système décimal, où encore système à base 
dix, d'origine indienne, est parvenu en Europe à la fin 
du XII® siècle, grâce au rayonnement mathématique arabe, 
par l'intermédiaire de Leonardo Filonacci, auteur du 
Liber abaci (1202). Il en a résulté un progrès décisif 
par rapport aux systèmes de numération grec et romain. 

Dans le système de numération décimale, comme dans 
tout système de numération positionnelle, les nombres 
entiers positifs sont représentés à l'aide d'une suite 
ordonnée finie d'entiers non négatifs tous strictement 
inférieurs à un nombre fixé à l'avance qui sera /a base 
du système, 10 dans le cas de la représentation décimale. 

L'usage du signe —, de la virgule et d'une suite infinie 
d'entiers inférieurs à la base permet alors de représenter 
tout nombre réel. Pour les nombres réels ainsi représentés, 
les règles d'addition et de multiplication seront très 
simples et faciliteront le calcul, même pour des nombres 
très grands. Elles seront valides quelle que soit la base, 
en particulier en base 2 qui est d’une très grande utilité 
pour le calcul automatique (cf. /nformatique). 

Tout entier positif peut s'écrire (grâce aux divisions 
avec reste suivant les puissances décroissantes de b) 
d'une facon et d'une seule sous la forme : 


8 = mb" + Qm1b® 1 +. + g1b + Go 


où g:; est un entier positif vérifiant pour tout / O < g; < b. 

À une représentation de ce type, on peut faire corres- 
pondre biunivoquement la suite finie G»mQm-1 9190. 
D'où, la base b étant fixée, une correspondance biuni- 
voque entre un nombre entier positif quelconque et la 
suite QmQm-1 190 (Suite qui ne commence jamais 
par zéro). Dans le cas b = 10, les g; sont 0, 1, …, 9: 
on obtient la représentation décimale usuelle. 


Exemple : 9 326 — 9105 — 3102 — 210 + 6. 


Si on veut représenter un nombre en base 12, il est 
nécessaire d'introduire deux symboles nouveaux; on ne 
peut en effet utiliser 11 et 12 qui sont déjà des représen- 
tations en base 10. On se servira, par exemple, des 
symboles 0, 1, 2, 3, …., 9, L, T. 

Les nombres représentés en base dix par 12, 13, 23, 24, 
115, 250 seront représentés dans un tel système par : 


10,11, 1T, 20, 97, 181. 


Les mêmes nombres dans le système binaire (base 2, 
les seuls chiffres utilisés sont 0 et 1) seront représentés par 
1 100,1 101,10 111, 11 000, 1 110 011, 11 111 010. 

Pour déterminer la représentation de 13 (base 10) 
en base 2, on commence par chercher la plus grande 
puissance de 2 qui divise 13, ici 13 — 23 — 5, puis la 
plus grande puissance de 2 qui divise 5 : 


13=23-22-7 1:23+1.22-0.21+1.20 


d'où la représentation 13 (base 10) — 1 101 (base 2). 

Les règles d'addition et de multiplication sont bien 
connues dans le système décimal, mais il n'y a pas de 
différence fondamentale entre le choix de 10 comme base 
ou d'un entier quelconque, ces règles sont analogues en 
base b à ce qu'elles étaient en base 10. On montrera sur 
un exemple comment se calcule le produit de deux 
nombres a et b représentés en base 10 par a = 115, 
b — 24, en base 12 par a — 97, b — 20, et en base 2 
par a — 1110011, b — 11 000. Alors : 


Yan - Rapho 
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Représentation 
décimale 
du nombre x. 


115 [ 97 


se 24 De 20 
base 10 | —— base 12 | —— 
460 4 00 
(A) 230 (B) | __172 
2760 1720 
1110011 
11 000 
\ 0000000 
base 2 0000000 
(C) 0000000 
| 1110011 
1110011 
101011001000 


Vérification en base 10 de l'opération (B) : 
2760=1-123-+7.122- 2.12 
Vérification en base 10 de l'opération (C) : 
2760 = 211 29 - 27 - 26 — 23, 
Les rationnels 


A côté des nombres entiers positifs on peut représenter 
par une suite finie de chiffres inférieurs à la base fixée, et 
à l'aide de la virgule, tout nombre rationnel du type sui- 
vant : 

(r) a = Qmb® + Qm-1b" 1 +... + g1b + Go 
+ g-1b 1 +... — gb 


La représentation de a dans le système sera : 


Im m1 + 91 90, 9-1 9-2 + In 

À partir d'une représentation en base b d'un nombre 
rationnel de ce type, on peut en obtenir une autre en 
ajoutant après g-, un nombre quelconque de zéros. 
On confondra ces représentations, et il Y aura toujours 
à cette identification près correspondance biunivoque 
entre un nombre et sa représentation. 

Tous les nombres rationnels n’admettent pas une repré- 
sentation de ce type, ni a fortiori tous les nombres réels. 
Pour obtenir un développement en base b d'un nombre 
réel quelconque, on procédera par approximations suc- 
cessives par des rationnels du type cité. Soit a un nombre 
réel positif, Qm Qm-1 … go le plus grand entier inférieur 
ou égal à 4, {m Qm-1 … go, g-1 le plus grand rationnel 
du type (r) avec un chiffre après la virgule, inférieur ou 
égal à 4, {m {m1 … Go, 9-1 9-2 le plus grand rationnel 
de type (r) avec deux chiffres après la virgule inférieur ou 
égal à a, etc. On engendre ainsi une suite avec une infinité 
de chiffres après la virgule 


Im Im-1 + 91 0, 9-1 9-2 + In 
Une telle suite va représenter le nombre a; quelle que soit 
la précision imposée, on pourra approcher le nombre réel a 
par un tel développement (il suffit de choisir n suffisam- 
ment grand). 

Deux nombres réels distincts ont deux représentations 
distinctes. Tout développement Qm» Qm-—1 90, 4-1: mi. 
représente un nombre réel positif bien déterminé, à 
savoir le nombre qui sépare la classe des nombres réels 
inférieurs ou égaux au nombre rationnel 9» … Go, {1 … Q-n 
pour tout entier positif », de la classe des nombres réels 
supérieurs ou égaux à ce nombre rationnel. 

La représentation d'un nombre réel négatif s'obtient 
en faisant précéder du signe — le développement de 
sa valeur absolue. 
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STRUCTURES ALGÉBRIQUES 


La notion de structure algébrique s'est dégagée pro- 
gressivement au cours du XIX® siècle; c'est l'’aboutisse- 
ment d'un processus d'axiomatisation de la recherche qui a 
conduit les mathématiciens à la création d'êtres mathéma- 
tiques nouveaux rassemblant les propriétés communes à 
divers ensembles concrets étudiés jusqu'alors de façon 
spécifique. 

L'étude des structures algébriques constitue l’objet de ce 
qu'on appelle l'algèbre moderne. Mais les origines de 
l'algèbre sont beaucoup plus anciennes puisque c'est aux 
Babyloniens et aux Égyptiens que l'on doit les premières 
règles de calcul sur les entiers naturels et les nombres 
rationnels positifs. 

Puis les Grecs, avec Euclide et plus tard Diophante, 
développèrent les règles du calcul algébrique abstrait, 
mais le champ de leurs recherches, encore très réduit, 
ne se prêtait pas à l'axiomatisation, le zéro et les nombres 
négatifs n'apparaissant qu'au haut Moyen Age chez les 
mathématiciens hindous. 

Ce sont les algébristes italiens du XVI® siècle qui 
introduiront les nombres complexes pour la résolution 
des équations du 3° et du 4° degré. 

D'autre part, la notation algébrique prend la forme que 
nous lui connaissons aujourd'hui à la fin du XVIe siècle 
avec Viète, qui, le premier, introduisit des lettres dans les 
équations algébriques, et surtout avec Descartes. 

La fin du XVIIE siècle et le XVIIIS siècle produiront peu 
de nouvelles découvertes en algèbre, et il faudra attendre 
les années 1800 pour que les recherches dans ce domaine 
prennent un nouvel essor (citons en particulier Gauss et 
Cauchy). 

C'est l'œuvre d'Abel et surtout de Galois qui marque 
le passage de l'algèbre classique à l'algèbre moderne en 


Palais de la Découver s 


reliant l'étude des équations algébriques à celle des grou- 
pes de permutation qui lui sont liés. Diverses notions 
abstraites commencent à apparaître : celle de groupe, 
qui domine les premières recherches; celle de loi de 
composition dégagée par les mathématiciens anglais 
entre 1830 et 1850; puis les études sur les nombres 
algébriques, qui sont à l’origine de recherches sur les 
corps et les anneaux (Dedekind, Hilbert). La synthèse 
de ces divers courants par l'usage de la méthode axioma- 
tique, qui marque le début de l'algèbre moderne, apparaît 
pour la première fois dans le livre de Steinitz : A/gebraische 
Theorie der Kôrper (1910); puis l'étude des structures 
se poursuit et s'enrichit grâce à Artin, Nœther et aux mathé- 
maticiens de leur école: le livre de Van der Waerden, 
Moderne Algebra (1930), premier exposé d'ensemble de 
l'algèbre moderne, a été le point de départ de toutes les 
recherches d’algèbre contemporaines. 

L'objet de ce chapitre est l'étude de certaines structures 
algébriques fondamentales comme celles des groupes, 
des anneaux et des corps, ainsi que des notions de base 
qui s'y rattachent; pour des développements ultérieurs, 
on pourra se reporter au chapitre A/gèbre linéaire. 


Lois de composition et catégories 


Lois de composition interne 


Si l'on se fixe un ensemble E, on appelle /oi de compo- 
sition interne dans E une application f d'une partie À de 
l'ensemble produit E x E (voir chapitre Les ensembles) 
dans E. Au couple (x, y) de À, la loi de composition 
interne fait correspondre un élément unique z de E : 


(x y) > z= f(x y) 


SiA=E x E, la loi est partout définie sur E, c'est alors 
une oi interne sur E; z s'appelle le composé de x et de y 
pour cette loi, et on le note avec des symboles divers : 


xLy: KTY 


Une loi notée par le signe — s'appelle le plus souvent 
addition (le composé x + y est alors la somme de x et 
de y); une loi notée par le signe + ou sans signe sera 
appelée multiplication (le composé x : y ou xy est alors 
le produit de x et de y) ; une loi quelconque sera générale- 
: ment notée x L you xT y. 

Citons comme exemples de lois de composition interne 
partout définies l'addition, la multiplication, l'exponentia- 
tion dans l'ensemble N des entiers naturels ; mais la sous- 
traction x — y dans N n'est définie que pour les couples 
(x, y) tels que x > y; de même, la division x/y dans N n'est 
définie que pour les couples (x, y) tels que y soit différent 
de zéro et que x soit multiple de y. 

Dans ce qui suit, nous ne parlerons, sauf précision 
contraire, que de lois partout définies. 

Associativité 

Soit E un ensemble muni d'une loi de composition 
interne notée T. Étant donné x, yet z, trois éléments de E, 
on peut calculer les composés (x T y) T zetx T (yT 2). 
La loi interne T sera associative si, quels que soient les 
éléments x, y, z de E, on a l'égalité : 


(XTy)Tz=xT (yT2) 


le composé est alors noté x T y T z. 
Plus généralement, on peut alors définir le composé de 
X1, X2, … Xn dans cet ordre : 


Ki À 20 T «4 Te 


L'addition, la multiplication des nombres de N, Z, Q, 
R, € (voir Théorie des ensembles) sont associatives; 
en revanche, l'exponentiation des entiers naturels ne 
l'est pas : en effet (21)°£ 24). 

Commutativité 

La loi L sera commutative si, pour tous les éléments 

x et y de E, on a l'égalité : 


XTyY=YTx 


Si cette propriété est vérifiée pour un couple (x, y) 
d'éléments de E, on dit alors que x et y sont permutables. 

L'addition et la multiplication des nombres de N, Z, 
Q, R, € sont commutatives, mais l'exponentiation des 
entiers naturels ne l'est pas. Si la loi T est à la fois asso- 
ciative et commutative, le composé de 7 éléments 
X1, X2, …, Xn de E, dans n'importe quel ordre cette fois, 
sera défini de manière unique : 


X+ y; X:y ou xy; 


Xi D Xe T 4 T Xn= Xe T 1 Ta TX == 
Xn. Toi À Xe D 2 T Xaex 


La notation additive sera généralement réservée à des 
lois commutatives. 
Élément neutre 

Un élément e de E sera appelé é/ément neutre pour la 
loi T si, pour tout élément x de E, on a les égalités : 


xXTe=eTx=x. 


Il existe, comme on le voit facilement d’après la défini- 
tion, au plus un élément neutre e pour une loi donnée; 
e est alors permutable avec tout élément de E; l'élément 
neutre d'une loi additive (notée par le signe +) est géné- 
ralement noté O, celui d'une loi multiplicative (notée 
par - ou sans signe) sera en général noté 1 (par analogie 
avec les éléments neutres respectivement pour l'addition 
et la multiplication dans N, Z, Q, R, C). Remarquons que 
l'exponentiation dans N n’admet pas d'élément neutre, 
non plus que la multiplication dans l'ensemble des 
nombres pairs. 

Éléments réguliers 
Lorsque x — x’, on a évidemment, pour tout élément 


adeE:aTx=aTxetxTa—x Ta. 
Réciproquement, si : 


a T x— a T x’ entraîne x = x’ 


A Le mathématicien 
français Évariste Galois 
(1811-1832). Dans une note 
rédigée quelques heures 
avant de mourir 

dans un duel, Galois 
résume sa théorie des 
équations algébriques. 


désigne en général une loi de composition dans un 


ensemble. 


se lit souvent « truc ». 


se lit souvent « antitruc ». 


se lit « étoile ». 
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Ciccione 


Figure 1 : composition 
dans une catégorie C. 


quel que soit x appartenant à E, on dira que a est régulier 
à gauche pour la loi T ; on définit de même un élément 
régulier à droite (on dit qu'on peut simplifier par a ces 
égalités). 

Si a est régulier à gauche et à droite, il est régulier 
pour la loi T. S'il existe un élément neutre e de la loi T, 
e est régulier. Tout nombre est régulier pour l'addition dans 
N, Z, Q, R, C mais O n'est pas régulier pour la multi- 
plication dans ces ensembles; pour l'exponentiation 
dans N, tout entier naturel autre que 0 et 1 est régulier. 
Éléments symétriques 

Si | admet un élément neutre e, on dira qu'un élément 
x’ de E est symétrique d'un élément x de E si: 


xXTx'=x Tx=e. 


On dit qu'un élément x est symétrisable s'il existe un 
élément symétrique de x. L'élément neutre est toujours 
son propre symétrique, c'est d'ailleurs le seul élément 
symétrisable de l'addition et de la multiplication dans N. 
Dans l'addition des nombres réels ou complexes, tout 
élément est symétrisable. Dans la multiplication de Q, 
R ou C, tout élément sauf O est symétrisable. L'élément 
symétrique de x pour une loi additive sera noté — x 
et appelé opposé de x, il sera noté x=1 (ou 1/x) pour une 
loi multiplicative et appelé inverse de x. 

Ajoutons quelques remarques : 

— le composé de x et de x lui-même sera noté 
additivement : 
x—+—x où 2x 


— et multiplicativement : 
xx ou x? 


— plus généralement, on posera: 


XLXx+L.+x=nx et x-x.….x—= xt (neN). 
a DS A — 
n fois n fois 


Ox désignera l'élément neutre d’une loi additive, et x0 
celui d'une loi multiplicative. 

Si À est une partie d'un ensemble E, muni d'une loi de 
composition interne notée T telle que : 


xEeA et yeAentraine x T yEeA 


on dit que A est stable pour T où encore que A est une 
partie stable de E pour cette loi. La restriction de la loiT 
à une partie stable de A de E est appelée loi induite par T 
sur À. (Exemple : la partie de N formée des nombres pairs 
est stable pour l'addition et la multiplication.) 


Lois de composition externes et relations entre 
lois de composition 


Lois de composition externes 

On appelle loi de composition externe entre éléments 
d'un ensemble Q (dit ensemble des opérateurs de la loi) 
et éléments d'un ensemble E une application f de Q x E 
dans E : à tout couple formé d'un élément x de Q et 
d'un élément x de E, on fait correspondre un élément y 
de E: 


y = f(x, x) (noté généralement y — x x où y = X 4) 


Les éléments de (Q (que nous désignerons par des 
lettres grecques) sont appelés les opérateurs de la loi. 
Étant donné une loi interne associative sur un ensemble 
E, notée multiplicativement, l'application qui au couple 
(n, x) (où n est un entier naturel différent de O et x un 
élément de E) fait correspondre nx où x” est une loi 
de composition externe entre éléments de N* et éléments 
de E. On peut prendre également pour E l'ensemble des 
vecteurs de R? et pour ensemble d'opérateurs l'ensemble 

a ea 
R : au couple (x, V) on fait correspondre le vecteur x V, 
multiplication d'un vecteur par un scalaire. 

On peut encore prendre pour E l’ensemble des fonc- 
tions dérivables de n variables réelles x1, …, x, et comme 
opérateurs les dérivations partielles par rapport aux va- 


. ê Q ; 
riables : ——, …., —; la loi externe fera alors correspondre 
ëx1 Xn 


à ,) cf 
f},oùfeE, l'application —. 
| où applicatio 2x 


êx; 


au couple { 
Relations entre lois de composition 

Si un ensemble d'opérateurs sur E, Q, est muni d'une 
loi interne associative (notée multiplicativement) telle 
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qu'on ait, pour tous les éléments x, 8 de QetxdeE, 
l'égalité : 
x (8x) = (x 6) x 

on dira que la loi externe est associative par rapport à 
la loi interne de Q. 

Si c'est l'ensemble E qui est muni d'une loi interne 
commutative (notée additivement) telle que, pour tous 
éléments x, y de E et tout x de Q, on ait l'égalité : 


L(X+<y)=4x—+4y 


on dira que la loi interne est distributive par rapport à la 
loi interne de E. 

Si dans E sont définies deux lois de composition, la 
première associative et commutative (notée additive- 
ment), la seconde associative (notée multiplicativement), 
on dira que la loi multiplicative est dstributive à gauche 
par rapport à la loi additive si : 


X (Y — Zz) = Xy — xz. 
On définit de même la distributivité à droite par : 
(Y + zZ)x = yx — zx 


Si la loi multiplicative est distributive à gauche et à 
droite par rapport à la loi additive, elle est distributive 
par rapport à celle-ci. Étant donné une loi multiplicative 
associative sur un ensemble E, la loi externe (n, x) — x? 
est associative par rapport à la multiplication dans N* 
puisque (x*)? — x"#2; si la loi sur E est également com- 
mutative, alors (x, y)" — x"y" et la loi externe est dis- 
tributive par rapport à la loi interne de E; la multiplication 
des nombres appartenant à N, 7, Q, R, C est distributive 
par rapport à l'addition de ces nombres. 

Nous avons, jusqu'à maintenant, considéré un 
ensemble E sur lequel étaient définies une (ou plusieurs) 
loi de composition interne et une (ou plusieurs) loi de 
composition externe avec un ensemble d'opérateurs Q; 
ces lois et les conditions auxquelles elles sont assujetties 
(associativité, élément neutre, etc.) déterminent ce qu'on 
appelle une structure algébrique sur E, et la suite de ce 
chapitre sera consacrée à l'étude de structures algébriques 
particulières. Nous allons tout d'abord, avant de procéder 
à une étude plus détaillée des groupes, des anneaux et 
des corps, donner quelques éléments sur les catégories. 


Catégories 


Un ensemble C muni d'une loi de composition interne 
(en général non partout définie) associative sera appelé 
une catégorie si les propriétés suivantes sont vérifiées 
(voir fig. 1) : 


B (f) = a (g) 


— il existe deux applications « et & de C dans une 
partie Co de C telles que la restriction de x et 5 à Co soit 
l'identité (si f € Co, alors x (f) = 8 (f) =f); 

— le composé g - f de deux éléments de C existe si, 
et seulement si, « (g) — 8 (f); on a alors : 


z(gef)=4(f) et 8 (g<f) — 8 (9) 
— pour tout élément f de C,ona: 


Un élément 7 de C est appelé sommet s'il appartient à 
Co, flèche de source x (f) et de but 8 (f) dans le cas 
contraire. Les applications d'un ensemble dans un autre, 
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par exemple, forment une catégorie pour la loi de compo- 
sition habituelle des applications (voir chapitre Les 
ensembles) une flèche f sera une application d'un 
ensemble E dans un ensemble E’, sa source x (f) = ide 
(application identique de E), son but 8 (f) = ide 
(ces applications ne forment pas à proprement parler un 
ensemble, nous utiliserons néanmoins, par souci de 
simplification, le terme de « catégorie des applications »). 
Foncteur 

Un foncteur d'une catégorie C dans une catégorie C” 
est une application F de l'ensemble C dans l’ensemble C’ 
telle que : 


— Ffx(f)]=2[F (fletF [8 ()] = 8 IF (1 
— sig-:fest défini dans C, alors 
F(g:f)=F(9)-F (#). 


On appelle parfois un tel foncteur foncteur covariant; 
un foncteur contravariant est alors une application qui 
«renverse le sens » des flèches (F (g-f) =F(f):F (g)). 

Si l'on considère par exemple la catégorie des homo- 
morphismes de groupes (voir plus loin), l'application qui 
à un homomorphisme d'un groupe G dans un groupe G’ 
fait correspondre l'application sous-jacente de l'ensem- 
ble G dans l’ensemble G” est un foncteur de la catégorie 
des homomorphismes de groupes dans la catégorie des 
applications ; un tel foncteur est appelé foncteur d'oubli. 
Produits et sommes 

Partant d'une catégorie C, considérons une famille 
(Si)ier de sommets de Co, on dira qu'un élément S de Co 
est une somme (respectivement un produit) des S; si 
les conditions suivantes sont vérifiées (voir fig. 2 et 3): 
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— pour tout /e |, il existe une flèche v; de C de 
source S;, de butS (respectivementde sources, de but S;); 

— si S’ est un autre sommet tel que, pour tout /el, 
on ait une flèche v’; de C de source S;, de but S’ (respecti- 
vement de source S’, de but S;), alors il existe une flèche 
unique h de source S et de but S” (respectivement de 
source S’, de but S) telle qu'on ait l'égalité : 


h:v;i= Vv'; (respectivement v; : À = v';) pour tout /el. 


Nous verrons par la suite des exemples de produits et 
de sommes dans des catégories; notons simplement que 
le produit cartésien de n ensembles : A1 x A2 x … x An 


(voir chapitre Les ensembles) est un produit de la famille 
(A;) dans la catégorie des applications (l'application 
identique de chacun des A; est identifiée à l'ensemble 
lui-même). 


LE GROUPE DE KLEIN 


H existe 4 transtormations géométriques apph 
quant un rectangle sur lui-même et conservant les 
| drstances mutuelles des sommets la tr 
| bon rdentique, les deux symétnes par # 

médianes et la symétne par rapport au € 
4 transformations vénhent la table ci-dessous 


- ABCD p,- ABCD | 
ABCD ‘'" BADC | 


p,- ABCD 
*_ CDAB 


ns de 4 lettres. consi 
F. 


M est donc avantageux d'étudier directement les propriétés d'un ensemble abstrait K 
de quatre éléments sur lequel on définit une loi de composition © grâce à la table ci-dessus 


Propriétés 


3} l'opération est associative. c'est-à-dire 
par exemple 
{se} (e je ee 
4) chaque élément admet un inverse. c'est 
dire un éiément Lei que. «+ 


1) le procut de 2 éléments de l'ensemble 
appartient à l'ensemble 
2) l'étérnent © est neutre pour l'opération 


Groupes 


Groupes et sous-groupes 


Groupes 

Fixons-nous un ensemble G, sur lequel existe une loi de 
composition interne partout définie; on dira que cette 
loi (que nous noterons multiplicativement) détermine 
sur G une structure de groupe (ou encore que G est un 
groupe) si elle possède les propriétés suivantes : 

— elle est associative : (xy) z — x (yz) (pour tous 
éléments x, y, z de G); 

— elle possède un élément neutre unique e 
ex = xe = x (pour tout x e G); 

— chaque élément x de G admet un symétrique 
unique x7l:x-1x=— xx-l—e. 

Si de plus la loi est commutative (xy — yx), le groupe G 
est alors commutatif où abélien (dans ce cas, la loi sera 
souvent notée additivement). Un groupe G est fini s'il 
comporte un nombre fini d'éléments », n est alors l'ordre 
du groupe; il est /nfini dans le cas contraire. 

Comme exemples de groupes, citons les ensembles 
Z, Q, R, C pour l'addition (l’ensemble N des entiers 
naturels n'est pas un groupe pour l'addition puisque 
aucun élément, sauf 0, n'admet de symétrique); si on 
considère la multiplication sur R, elle vérifie les deux pre- 
mières propriétés, mais O n'admet pas de symétrique : 
c'est l'ensemble R moins zéro qui est un groupe pour la 
multiplication. Tous ces groupes sont des groupes 
abéliens infinis. Le groupe Z/n7 des entiers modulo n, 
ensemble quotient de Z par la relation d'équivalence 
R :xRy si, et seulement si x — y — nz (2€ Z) (voir 
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Ce groupe d'ordre 4 [| vrdre es: 


de ses éléments) s appelle le G 
KLEIN 


1 le nombre 
ROUPE D£ 


A On doit à Félix Klein, 
mathématicien allemand 
(1849-1925), d'importants 
travaux, notamment sur 
l'application de Ja théorie 
des groupes à /a géométrie. 


<« En haut, figure 2 : 
somme S de la famille 
(Si)ier où l'est un 
ensemble d'indices 
quelconque . 

En bas, figure 3 : 
produit S de la famille 
(Si)i:er où lestun 
ensemble d'indices 
quelconque. 


Palais de la Découverte, Paris 
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A Figure 4; 

A : addition (1) 

et multiplication (2) 
dans Z/ 37; 

B : addition (1) 

et multiplication (2) 
dans z /67Z. 


chapitre Les ensembles), dont les éléments sont donc les 
classes d'équivalence suivant R, est un groupe pour 
l'addition (voir ci-dessous) ; c'est un groupe fini d'ordre n 
(voir fig. 4). 


Si E est un ensemble, considérons l'ensemble des appli- 
cations biunivoques (ou bijections) de E sur lui-même; 
cet ensemble est muni d'une structure de groupe pour la 
composition des applications; en effet : 

— fs (gch) = (f:g)-h (quelles que soient les 
applications f, g, h); Lo 

— l'application identique de E est élément neutre; 

— chaque élément admet un symétrique unique, 
l'application réciproque. 

Le groupe, noté Sg, s'appelle groupe symétrique de 
l'ensemble E. Si l'ensemble E comporte n éléments, 
le groupe symétrique de E est encore appelé groupe de 
substitution, et on le note alors S:. 

Sous-groupes 

Fixons-nous un groupe (multiplicatif) G. Une partie 
H de G sera un sous-groupe de G, si H est lui-même 
un groupe pour la loi induite par celle de G. On a les résul- 
tats suivants : H est un sous-groupe de G si, et seulement 
si, l’une ou l’autre des conditions suivantes est vérifiée : 
(1) H est une partie stable de G (si xe H et yEeH, 
alors xy e H), et le symétrique de tout élément de H 
appartient encore à H ; 

(2) sixeHetyehH, alors xy-1€H. 

En effet, si H est un groupe, il est évidemment stable 
pour la multiplication de G puisque la loi induite sur H 
par celle de G doit être partout définie ; l'élément neutre e” 
de H est le même que e, élément neutre de G, puisqu'on a: 
e’e = e’ et donc e —e’ (e’e 1) —ee-1=e; il en 
résulte que l'élément symétrique (ou inverse) de x dans H 
est identique à son inverse dans G, ce qui démontre (1), 
d'où on déduit immédiatement (2). Réciproquement, 
partant de l'hypothèse (2), on en déduit que l'élément 
neutre e de G appartient à H (il suffit de prendre y = x) 
d'où, si yEH, alors y-LeH (on prend x = e), et la 
stabilité se déduit immédiatement : x (y-1)-? = xyeH; 
il en résulte qu'il existe bien sur H une loi de composition 
interne partout définie, évidemment associative (puis- 
qu'elle possède cette propriété dans G), admettant un 
élément neutre e, et telle que tout élément de H possède 
un symétrique dans H : H est un groupe. 

Nous avons vu que les ensembles Z, Q, R, C sont des 
groupes pour l'addition; il est immédiat que, pour cette 
même loi, Z est un sous-groupe de Q qui est lui-même un 
sous-groupe de KR, lui-même un sous-groupe de C. 
Un sous-groupe du groupe additif Z qui n'est pas réduit 
au seul élément O sera formé de tous les entiers de la 
forme pn (multiples de n) où p € Z et n est le plus petit 
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élément positif de ce sous-groupe (un tel ensemble est 
encore noté n7). 

Étant donné un groupe multiplicatif G et un élément x 
de G distinct de e, considérons l'ensemble des éléments 
de G de la forme x? pour n € Z. Cet ensemble constitue 
un sous-groupe H de G dont x est le générateur. Ce 
groupe H, que l'on appelle groupe cyclique ou groupe 
monogène, est évidemment abélien. 

Il peut être : 

soit infini, et c'est alors l'ensemble formé des éléments : 


LR, ne NUE GX es Nbre 


soit fini dans le cas où il existe un entier positif tel que 
x? —e; si n est le plus petit entier possédant cette 
propriété, H est alors un groupe fini d'ordre n formé des 
éléments: 


e,X,.…, X T1, 


Citons comme exemple de groupe cyclique fini le 
groupe multiplicatif engendré par — 1 : c'est un groupe 
d'ordre 2 formé des éléments — 1 et + 1. 


Groupes quotients 


Classes suivant un sous-groupe 

Fixons-nous un groupe multiplicatif G et supposons 
définie une relation d'équivalence R sur G. On dira que 
la relation d'équivalence R est compatible à gauche avec 
la loi du groupe si la propriété suivante est vérifiée : 

si x et x’, éléments de G, sont tels que x R x’, alors 
yx R yx’ pour tout yE G. 
On définit de même une relation compatible à droite : 
x R x’ entraîne xy R x’y (pour tout y € G). 
Si R est compatible à droite et à gauche avec la loi de G, 
on dit que R est compatible avec cette loi; elle vérifie 
dans ce cas: 
six R x’'ety R y’, alors xy R x'y’. 

Supposons maintenant donnée une relation d'équi- 
valence R sur G compatible à gauche; si x et y de G 
sont tels que x R y, on aura aussi e — xx R x-ly et 
donc x-1ly appartient à la classe d'équivalence H de e 
(H est la partie de G formée des éléments xtels que x R e); 
montrons que H est un sous-groupe de G, c'est-à-dire, 
comme nous l'avons vu, que si x€ H et y € H, alors 
xy-1eH:yeHs'écritencore y R e d'oùe=y-1yRy-1, 
et donc xy-1R x: partransitivité (voir chapitre Les ensem- 
bles), on obtient, puisque x Re, xy-L'R e et donc xy-1€H. 
Réciproquement, on montre facilement que, si H est un 
sous-groupe quelconque de G, la relation x R y si, et 
seulement si x-lye H est une relation d'équivalence 
compatible à gauche avec la loi du groupe, d'où le résultat. 

Toute relation d'équivalence R compatible à gauche 
avec la loi d'un groupe G est de la forme x 1y € H, H étant 
un sous-groupe quelconque de G; de même, toute rela- 
tion d'équivalence R compatible à droite avec la loi 
d'un groupe G est de la forme yx=-1e H, H étant un sous- 
groupe quelconque de G. La classe d'un élément x de G 
suivant une relation compatible à gauche sera donc formée 
des éléments xy de G tels que y € H : on la note xH; 
Hx sera la classe de x suivant une relation compatible 
à droite ; ces classes s'appellent respectivement c/asses à 
gauche et classes à droite suivant (ou modulo) H. 

Toutes ces classes ont même puissance puisqu'on peut 
établir une correspondance biunivoque entre xH et yH; 
en particulier, si G est d'ordre fini, comme H l'est néces- 
sairement aussi, et que les classes suivant H n'ont pas 
d'éléments communs, on en déduit la propriété suivante : 

dans un groupe fini, l'ordre d'un sous-groupe 
quelconque est un diviseur de l'ordre du groupe. 
Sous-groupes distingués et groupes quotients 

Un sous-groupe H de G s'appelle sous-groupe dis- 

tingué (ou invariant) de G si l'on a: 


xHx=1= H  (pourtoutxe G): 


un sous-groupe H sera distingué si, pour tout y € H et 
toutxeG,ona:xyx EH. 

Les classes à gauche et à droite suivant H sont alors 
confondues, puisque xHx=1 = H entraîne xH = Hx et 
la relation d'équivalence R : 


x-1ly € H est compatible avec la loi du groupe. 


Si l’on considère l'ensemble quotient G/R dont les 
éléments sont les classes d'équivalence de G suivant R, 
on peut définir sur cet ensemble la loi de composition 


suivante (x désigne la classe suivant R d'un élément 
quelconque x de G) : 
XY = XY: 
Cette loi est bien partout définie sur G/R et vérifie 
de plus que : 
— elle est associative (puisque la loi de G l'est); 
— elle possède un élément neutre €; . 
— tout élément x admet un symétrique x-1 — x-1. 
G/R est donc un groupe encore noté G/H et appelé 
groupe quotient de G par le sous-groupe distingué H. 
Notons que si la loi de composition d'un groupe G est 
commutative, pour tous les éléments x, y de G on a: 
xyx-1 = y; donc tout sous-groupe d'un groupe abélien 
est distingué ; en particulier, considérons le groupe addi- 
tif Z : nous avons vu que ses sous-groupes sont de la 
forme nZ avec ne N°; la relation x— yenZ s'écrit 
encore : 


x = y (modulo n) 


et se lit x est congru à y modulo n; les groupes quotients 
de Z par un sous-groupe n7Z seront notés Z/n7, et un 
tel groupe s'appelle groupe additif des entiers rationnels 
modulo n; c'est un groupe fini d'ordre n (fig. 4 Ar et B1). 


Homomorphismes de groupes produits 


Homomorphismes de groupes 

Une application f d'un groupe G dans un groupe G’ 
(dont les lois sont notées multiplicativement) est un 
homomorphisme de groupes si : 


F (xy) = F (x) F (y) 


(pour tout x, tout y appartenant à G); dans ce cas, sie 
désigne l'élément neutre de G, e’ celui de G” 

— e =f(e); f(x 1) = [FI t; 

— f (G) est un sous-groupe de G’ appelé image de f 
noté Im (f); 

— l'ensemble f-1 (e’) est un sous-groupe distingué 
de G, appelé noyau de l'homomorphisme et noté Ker (f); 
rappelons que f-1 (e’) est formé des éléments x de G tels 
que f (x) — e’. 

Si, de plus, l'application 7 est bijective, f est alors un 
isomorphisme, et l'application réciproque f-1 est un iso- 
morphisme de G’ sur G; les groupes G et G’ sont alors 
dits /somorphes : en particulier, tout groupe cyclique G 
d'ordre nestisomorphe à Z/n7 (siG — {e, x, x2,.…., x2-1}, 
l'application f telle que 


f(e)=0,f(x) = 1, f(xt1) = n—1 


est un isomorphisme de G sur Z/n7). 

Un homomorphisme de G dans lui-même s'appelle un 
endomorphisme de G, et un endomorphisme bijectif 
s'appelle un automorphisme de G : si a est un élément 
fixé d'un groupe G, l'application f,; de G dans G définie 
par fa (x) = axa-l est un automorphisme de G; l'en- 
semble de tels automorphismes f, pour a € G forme un 
groupe pour la loi de composition des applications; 
ce groupe s'appelle groupe des automorphismes inté- 
rieurs de G. 

Si H est un sous-groupe distingué de G, l'application 
f de G sur G/H définie par f (x) — X est un homomor- 
phisme surjectif que l'on appelle homomorphisme cano- 
nique de G sur G/H; si maintenant f est un homomor- 
phisme de G dans un groupe G’, appelons s l'homomor- 
phisme canonique de G sur G/Ker (f) (nous avons vu 
que Ker (f) est un sous-groupe distingué de Gj); le 
groupe quotient G/Ker (f) est isomorphe à l'image f (G) 
par l'application K : 


k (x) = f(x); 


d'autre part, l'application identique : / (x) — x’ de f (G) 
dans G’ est un homomorphisme injectif (canonique). 
Nous avons alors procédé à ce qu'on appelle la décompo- 
sition canonique de l'homomorphisme 7, c'est-à-dire 
écrit / comme le composé de trois homomorphismes 
canoniques :f—i-.k:soù 

— s est l'homomorphisme canonique de G sur 
Ker (f); 

— k est l'isomorphisme canonique de G/Ker (f) 
sur f (v); 

— ji est 
dans G’. 


l'homomorphisme canonique de f (G) 


Groupe produit 

Comme le composé de deux homomorphismes est 
encore un homomorphisme, les homomorphismes de 
groupes forment une catégorie pour la composition des 
applications (sous la réserve faite précédemment); 
considérons n sommets (ou objets) de cette catégorie; 
Gi, …, Gr; chacun des G; est un groupe (identifié à 
son application identique), et l'ensemble produit 
G— G1 x G2 x … x Gx (encore noté II G;) peut 
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être muni d'une structure de groupe de la facon sui- 
vante : considérons sur G la loi de composition donnée 
par la formule 


(X1, Xn) (V1. Yn) = (X1Y1, … XnYn) 


— elle est associative (cela résulte de l'associativité 
des lois de G1, …, G»); 

— elle possède un élément neutre e — (ex, …, en) 
(où e; désigne l'élément neutre de G; pour 1 </<n); 

— tout x — (x1, …, Xh) admet un inverse 


Le (ls). 


Le groupe G s'appelle groupe produit des groupes 
G1,…, Gr (le résultat, ainsi que ce qui va suivre, est 
encore valable pour une famille quelconque (Gi;:er 
de groupes). 

Pour tout /, l'application p; de G dans G; définie par 
pi (X1, .…., Xn) = x; est évidemment un homomorphisme 
de groupes; supposons de plus donnés un groupe G’ 
ainsi que n homomorphismes p'1, …, ph de G’ dans les 
groupes G:;, il existe alors un unique homomorphisme A 
de G’ dans G tel que pourtout/ — 1,...,n,onaitp;-h=p;; 
c'est l'homomorphisme : h (x) — (p1’ (x), …, pn° (x’)) 
pour tout x’Ee G’. Le groupe G est donc un produit de 
G1, …, Gn dans la catégorie des homomorphismes de 
groupes. 


Anneaux et corps 


Anneaux 


Un ensemble À muni de deux lois de composition 
internes (une addition et une multiplication) est appelé 
un anneau Si: 

— À est un groupe abélien pour l'addition; 

— la multiplication est associative; 

— la multiplication est distributive par rapport à 
l'addition. 

Les hypothèses sur l'addition dans A s'expriment par les 
égalités: 

x + (y + 2) (x — y) — z (associativité) 
X— y = y— x (commutativité) 


par l'existence d'un élément neutre noté O tel que : 
x+—0=x 


et par l'existence, pour tout x, d'un élément opposé à 
X, — X, tel que : 


X— (— x) = 0 ouencore x—x= 0. 


Les hypothèses sur la multiplication s'expriment par les 
égalités : 

x (yz) — (xy) z (associativité) ; 
A LIT | (distributivité). 

Si la multiplication est commutative, on dit que l'anneau 
est commutatif ou abélien. 

Si la multiplication possède un élément neutre, cet 
élément, qui s'appelle é/ément unité de À, est alors en 
général noté 1 et À est appelé anneau unitaire. Nous avons 
vu que Z est un groupe abélien pour l'addition, et que la 
multiplication sur Z est associative et distributive par 
rapport à l'addition; Z, muni de ces deux lois, est donc 
un anneau que l'on appelle anneau des entiers rationnels ; 
c'est un anneau commutatif unitaire (d'élément unité 
— 1); de même, comme nous le verrons par la suite, pour 
tout n e N°, Z/nZ est un anneau abélien unitaire. 

Nous allons voir maintenant quelques propriétés des 
anneaux : 

— y — (— x) noté y — x nous donne la soustrac- 
tion, opération inverse de l'addition et par rapport à laquelle 
la multiplication est distributive ; 

— le produit d'un élément quelconque de A par O est 
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toujours égal à O (x0 = x (y — y) = xy — xy = 0), 
mais inversement, il peut exister des éléments x, y de H 
différents de O tels que xy — 0; de tels éléments sont 
alors appelés diviseurs de zéro. Un anneau commutatif, 
non réduit à 0 et dépourvu de diviseurs de zéro, est appelé 
anneau intègre où anneau d'intégrité : l'anneau Z est 
un anneau intègre mais l'anneau Z/67 (voir fig. 4B>) 
a des diviseurs de zéro : 2 : 3 — O0, on voit qu'un anneau 
Z/nZ est intègre si, et seulement si n est premier; 

— si À est abélien, la formule du binôme de Newton 
est vérifiée : 
(X<+ y} =.xr + Cox ly E + Cox PyP + 

sr Cr ixyr1l — y (n e N*) 


cette formule étant encore valable dans un anneau non 
commutatif si x et y sont permutables (c'est-à-dire si 
Xy = yx); 

— s'il existe un entier positif » tel que, pour tout 
élément x de À, on ait nx = O0, on dit que À est de caracté- 
ristique non nulle ; si n est le plus petit entier vérifiant cette 
propriété, À est de caractéristique n; si ce n'est le cas 
d'aucun entier, l'anneau est de caractéristique nulle : 
Z est de caractéristique nulle, alors que Z/n7, pour n pre- 
mier, est de caractéristique n. 

Sous-anneaux 

Si une partie B d'un anneau A est elle-même un anneau 
pour les lois induites sur B par celles de À, on dit que B 
est un sous-anneau de À; les sous-anneaux de À sont les 
parties B de A qui vérifient les deux propriétés : 

— B est un sous-groupe du groupe additif de A; 

— Best stable pour la multiplication. 

Z est un sous-anneau de qui est lui-même un sous- 
anneau de R, lui-même un sous-anneau de C ; les sous- 
groupes 77 de Z sont des sous-anneaux de Z (on peut 
remarquer que, bien que Z soit un anneau unitaire, 
pourn > 2cesanneauxnesont pas unitaires ;en revanche, 
les sous-anneaux d'un anneau commutatif ou intègre sont 
eux-mêmes respectivement commutatifs ou intègres). 
Idéaux 

Si B est un sous-anneau de À, la relation x R y si, et 
seulement si x—yeB est une relation d'équivalence 
compatible avec l'addition mais, en général, pas avec la 
multiplication ; en effet, si R est compatible à gauche avec 
la multiplication, on doit avoir pour tout élément z de A 


xR y entraîne zx R zy 
ou encore 
x—yeB entraine zx—zyeB (ouz(x—7y)eB) 


ce qui n'est généralement pas vrai pour un sous-anneau 
quelconque; pour obtenir une relation compatible avec 
la multiplication, on est donc conduit à considérer des 
sous-anneaux particuliers. 

On appelle /déal à gauche de A une partie | de A qui 
vérifie les deux propriétés suivantes : 


(1) — l'est un sous-groupe du groupe additif de A 
(aelethbelentranea—bel) 
(2) — pour tout élément x de A, xl = | 


(si xe Aetael alors xa€ |) 

On définit de même un /déal à droite par la propriété (1) 
et la propriété : 

(2°) — pour tout élément x de À, Ix = |. 

Un idéal à gauche et à droite est appelé /déal bilatère de 
A (remarquons que, si À est commutatif, tout idéal de A 
est bilatère). 

Si À est un anneau quelconque, {0} et A sont des idéaux 
bilatères de A; un idéal distinct de {0} et A s'appelle 
idéal propre de A; les idéaux de Z sont les sous-anneaux 
nz, car, pour tout élément p de Z, p (na) — n (pa) e nZ. 

Voyons maintenant quelques propriétés des idéaux : 

— l'intersection d'une famille d'idéaux à gauche est 
encore un idéal à gauche; en particulier, l'intersection de 
tous les idéaux à gauche qui contiennent une partie 
donnée H de A est encore un idéal à gauche, appelé idéal 
à gauche engendré par H ; on dit alors que H est un système 
de générateurs de cet idéal (ces propriétés sont encore 
valables si on remplace partout « idéal à gauche » par 
«idéal à droite » ou « idéal bilatère ») ; 

— si a est un élément fixé de À, &aA (formé des élé- 
ments ax où x € À) est un idéal à droite, Aa (formé des 
éléments xa où x € A) est un idéal à gauche de A. Si A 
est un anneau unitaire, l'idéal à gauche Aa contient a, 
et il est clair que tout idéal à gauche contenant a contien- 
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dra aussi Aa : Aa est l'idéal à gauche engendré par a; 
si, de plus, À est commutatif, l'idéal 2A — Aa engendré 
par a se note (a) et s'appelle /déa/ principal; un anneau 
intègre unitaire dont tout idéal est principal s'appelle 
un anneau principal : Z est un anneau principal; 

— si À est un anneau commutatif, on appellera 
idéal maximal un idéal | qui possède les propriétés sui- 
vantes : 

1) l'est différent de A; 
2) il n'existe pas d'idéal de À, différent de A et 
de | lui-même, qui contienne I. 
Ces propriétés peuvent encore s'exprimer : 

— l'idéallestmaximalsilestun élément maximal pour 
l'inclusion de l'ensemble des idéaux de A distincts de A 
(voir chapitre Les ensembles) ; 

— dans 7, l'idéal 67 n'est pas maximal, car il est 
contenu dans les idéaux 27 et 37, mais 77 est maximal: 
un idéal pZ de Z sera maximal si, et seulement si p est 
premier. 

Anneaux quotients 

Nous avons vu, c'est ce qui nous a amené à la définition 
d'un idéal, que, si R est une relation d'équivalence sur 
un anneau À compatible avec l'addition : 


x y si, et seulement si, xX—yel 
(où | est un sous-groupe de A), 


elle n'est compatible à gauche avec la multiplication que 
si | est un idéal à gauche de A; de même, elle n'est 
compatible à droite avec la multiplication que si | est un 
idéal à droite de A. Pour que ‘À soit compatible avec 
l'addition et la multiplication, il faut et il suffit donc que | 
soit un idéal bilatère de A. L'ensemble quotient A/R 
est alors un anneau si on le munit de l'addition : 


X+Y=X—y 


pour laquelle, nous l'avons vu, A/R possède une structure 
de groupe et de la multiplication : 

XY = XY 
qui est bien associative et distributive par rapport à 
l'addition. On appelle A/R anneau quotient de A par |, 
et on le note A/I. 
Homomorphismes d’anneaux 

Une application f d'un anneau À dans un anneau A 
est un homomorphisme d'anneaux si: 

F(x—y)= f(x) + F(y) et FCxy) = f(x) F (y) 
pour tous les éléments x, y de A. Dans ce cas, on a aussi: 

— (0) — 0; F(— x) = — f(x); 

— f (A) est un sous-anneau de A’; 

— l'ensemble f-1 (0) est un idéal bilatère de A 
appelé noyau de l'homomorphisme ; 

— en outre, si À et A’ sont unitaires d'éléments unités 
respectifseete’,f (e) = e’. 

L'application de A sur A/I, où | est un idéal bilatère 
de À, définie par : f (x) — X, est un homomorphisme 
surjectif, appelé homomorphisme canonique de A sur A/I. 

Comme dans le cas des homomorphismes de groupes, 
un homomorphisme bijectif d'un anneau A sur un anneau 
A’ s'appelle un isomorphisme de A sur A’ (A et A’ sont 
alors /somorphes) ; un homomorphisme de À dans lui- 
même s'appelle un endomorphisme de À et un auto- 
morphisme de A s'il est bijectif. 

Si f est un homomorphisme d'un anneau À dans un 
anneau A’, on peut procéder, comme dans le cas des 
groupes a’, à sa décomposition canonique. 

Si f est un homomorphisme d'un anneau À dans un 
anneau À’, g un homomorphisme de A’ dans un anneau A”, 
le composé g - f est encore un homomorphisme d'an- 
neaux : les homomorphismes d'anneaux forment une 
catégorie pour la composition des applications ; si A1, …, An 
sont 7? anneaux, considérons l'ensemble produit 
A = Aix … XAn; nous avons vu que À est un groupe 
pour l'addition : 


(Xe, Xn) + (Vas Vn) = (Xi + Yi Xn + Yn) ; 
si, de plus, on considère la multiplication définie par : 
(Ke Xn) + (Yi Yn) = (Y1 + XnYn), 


ces deux lois confèrent à À une structure d'anneau; on 
voit facilement que À, anneau produit de A, …, An, est 
leur produit dans la catégorie des homomorphismes d'an- 
neaux (ces résultats sont également valables pour une 
famille quelconque (Ai);e; d'anneaux). 


Corps 


Certains éléments d'un anneau peuvent admettre un 
symétrique pour la multiplication : c'est le cas, dans Z, 
de — 1 et de 1; nous allons voir qu'un corps est un 
anneau caractérisé par la propriété que tous ses éléments, 
sauf le zéro de l'addition, possèdent un inverse pour la 
multiplication. 

Un ensemble K, muni d'une addition et d'une multi- 
plication, est un corps s'il possède les deux propriétés : 

— K est un anneau pour ces deux lois; 
— les éléments de K distincts du zéro de l'addition 
forment un groupe pour la multiplication. 

L'ensemble des éléments distincts de zéro d'un corps 
K se notera généralement K* : c'est le groupe multiplicatif 
du corps; on peut remarquer qu'un corps possède au 
moins deux éléments : les éléments unités de chacune des 
deux lois. 

Un corps est dit commutatif si son groupe multipli- 
catif est abélien. 

Un corps K est de caractéristique n si l'anneau K 
est de caractéristique n. 

L'anneau Z n'est pas un corps puisque ses éléments 
n'admettent en général pas d'inverse pour la multipli- 
cation : en revanche, Q, R, C sont des corps commutatifs. 

Voyons maintenant quelques propriétés des corps : 

— dans un corps, un produit est nul si, etseulement si 
l'un des facteurs au moins est nul; ce qui revient à dire 
qu'un corps ne peut avoir de diviseurs de zéro; en effet, 
si: 

ab — 0 (avec a O0) 
comme a admet un inverse al pour la multiplication, 
a lab = b = O0. 


Nous avons vu que, si n n'est pas premier, les anneaux 
Z/nZ possèdent des diviseurs de zéro (ce sont les classes 
des éléments m, p de Z tels que mp = n) ; de tels anneaux 
ne sont donc pas des corps; en revanche, si p est premier, 
Z/pZ est un corps de caractéristique p : dans Z/37 par 


exemple, qui comporte les trois éléments O0, 1 et 2, 1 et 2 
sont leur propre inverse pour la multiplication (voir fig. 
4A2) ; plus généralement : 

si À est un anneau commutatif et | un idéal maximalde 
À, alors A/l est un corps. 

Citons encore les propriétés suivantes : 

— tout anneau intègre unitaire fini est un corps; 

— les seuls idéaux (à gauche ou à droite) d'un corps 
K considéré comme anneau sont {0} et K; en effet, consi- 
dérons un idéal à gauche | de K (le raisonnement est 
analogue pour un idéal à droite); si | -£ {0}, il existe 
x 5 0 appartenant à |, d'où x-1x — 1 e let donc y:1 = y 
appartient à | pour tout élément y de K:1 = K. 
Sous-corps 

Une partie L de K qui est elle-même un corps pour 
l'addition et la multiplication induites par celles de K 
s'appelle un sous-corps de K; on dit alors que K est un 
Surcorps ou une extension du corps L. Un sous-corps L 
de K est une partie de K qui vérifie les propriétés suivantes: 

— L'est un sous-anneau de K (K étant considéré 
comme anneau) ; 

— les inverses dans K de tous les éléments de L 
appartiennent à L. 

est un sous-corps de R, € une extension de R. 
Tout sous-corps d'un corps K distinct de K est appelé 
sous-corps propre de K. Un corps est dit premier s'il ne 
contient aucun sous-corps propre : si p est premier, 
Z/pZ est un corps premier. L'intersection d'une famille 
quelconque de sous-corps de K est encore un sous- 
corps de K; en particulier, l'intersection de tous les sous- 
corps contenant une partie non vide B de K est un sous- 
corps de K : c'est le sous-corps de K engendré par B. 
Homomorphismes de corps 

Les corps étant des anneaux particuliers, un homo- 
morphisme d'un corps K dans un corps K’ est simplement 
un homomorphisme d'anneau de K dans K’; mais ces 
homomorphismes possèdent une propriété qui nous donne 
des résultats particulièrement simples. 

En effet, nous savons que le noyau d'un homomor- 
phisme d'un anneau A dans un anneau A’ est un idéal 
bilatère de A; comme les seuls idéaux d'un corps sont {0} 
et le corps lui-même, si f est un homomorphisme d'un 
corps K dans un corps K’, deux cas peuvent se présenter : 


— f-1 (0) = K et f (K) est un anneau réduit à 0 
(pour tout élément x de K, f (x) — O0); 
ou bien 
— f-1 (0) — {0}; f est alors un homomorphisme 
injectif de K dans K’ et f (K) est un corps isomorphe à K; 
en particulier, si f est surjectif, les corps K et K’ sont iso- 
morphes. 
Corps des fractions d’un anneau intègre 
Nous avons vu qu'un corps est dépourvu de diviseurs 
de zéro ; de même, tout sous-anneau de ce corps possède 
cette propriété d'où il résulte que tcut sous-anneau d'un 
corps commutatif est un anneau intègre. Nous allons voir 
que réciproquement, étant donné un anneau intègre À, 
il est possible de trouver un corps commutatif K dont A 
soit un sous-anneau; on dit encore que l’on va plonger A 
dans un corps K. 
Soit donc À un anneau intègre, notons A* l'ensemble 
des éléments non nuls de A; la relation : 


Xy° = X'y 
définit une relation d'équivalence R dans l’ensemble 
A x A°: 
(x, x’) R (y, y’) si, et seulement si xy’ = x’y; 
on peut définir de plus dans À x A*, une addition par : 
CC x) + (y) = (xy' + x'y, x y) 
et une multiplication par : 
(xx) + (y) = (xy, x'y) 

On vérifie facilement que ces lois sont associatives 
et commutatives, que la multiplication est distributive 
par rapport à l'addition, et que, de plus, R est compatible 
avec ces lois. On peut donc définir dans l'ensemble quo- 


tient K = À x A‘/R l'addition et la multiplication habi- 
tuelles qui sont, si l'on convient de noter x/x’ la classe 


d'équivalence (x, x’): 
xXIx" + y = Cy°+ xx y" 
Cx/x) + (y/y) = xy/x'y 
— en outre, la multiplication a un élément neutre, 
y'/y' noté 1 (y’ est un élément quelconque de A* : 
pour tout z’e A*,z’/z° = y'y') car: 
Cx/x) + (9/9) = (y /y) + (xx) = x/x (y'xx" = y'x'x) 
— l'addition a un élément neutre, 0/y’ noté 0 
(pour tout y’ de A*, tout z’ de A*, on a 0/y’ = 0/z') car: 
2 O/y = xy'Ix y = (xx) T = x/x° 
— tout élément x/x’ a un opposé pour l'addition, 
(— x)/x' : x/x! = (— x)/x! = O/xx" — 0 
— tout élément x/x’ distinct de O a un inverse pour la 
multiplication, x’/x (si x/x°Æ 0, alors x e A*) : 


XIX 


(xx) = (x) = xx xx" = 1 

K est donc bien un corps commutatif ; ce corps ne contient 
pas À mais, si l'on considère la partie B de K comportant 
les éléments de la forme xx’/x’ où x € A, on voit qu'elle 
constitue un sous-anneau de K isomorphe à A (xx’/x 
correspondant à x par cette bijection) ; en identifiant B à A, 
on obtient bien un corps commutatif K’, isomorphe à K 
qui contient À. K’ s'appelle le corps des fractions de A. 

Si l’on prend pour A l'anneau Z, le corps K’ n'est autre, 
par construction, que le corps Q des nombres rationnels. 
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> Le chevalier de Méré 
(v. 1607-1685); 
il connut Pascal vers 1652. 


Le triangle de Pascal. 


Palais de la Découverte, Paris 


COMBINATOIRE 


Tout enfant sorti des classes primaires est censé savoir 
compter. Compter les billes contenues dans un sac, 
déterminer le nombre de voix obtenues par un candidat 
lors d'une élection sont des opérations simples — fasti- 
dieuses peut-être; mais elles ne posent guère de pro- 
blèmes de méthode. |l s'agit uniquement de procéder à 
une énumération en prenant toutes les billes du sac ou 
tous les bulletins de l'urne un à un. 

Par contre, évaluer le nombre d'anagrammes que l'on 
peut réaliser avec les lettres du mot « Anticonstitutionnel- 
lement », calculer combien il y a de donnes possibles dans 
un jeu de tarots contenant les 3 bouts sont des opérations 
qui deviennent inextricables si l'on ne dispose pas de 
méthodes de dénombrement qui permettent de faire 
l'économie d'une énumération directe de toutes les 
possibilités. La combinatoire est justement l'étude de 
ces méthodes de dénombrement. Elle est à la base du 
calcul des probabilités : historiquement, elle est née d'un 
problème posé à Pascal par le chevalier de Méré (1654). 
L'auteur des Provinciales sut le résoudre et fournit ainsi 
les premiers éléments des probabilités. 


La combinatoire : la mathématique des grands 
nombres 


Soit À un ensemble (fini); on appelle cardinal de A 
(noté card A) le nombre d'éléments de A. Lorsque le 
nombre card À semble à priori très élevé, il sera souvent 
possible de montrer mathématiquement qu'il existe 
une bijection entre À et un sous-ensemble particulier 
de l'ensemble FE des applications d'un ensemble E 
dans un ensemble F. C'est pour cela que la combinatoire 
s'est avant tout consacrée au dénombrement des ensem- 
bles d'applications. 


Exemple 1 — Arrangements 

Soit à résoudre le problème suivant : de combien de 
façons différentes peut-on regrouper n éléments en sous- 
ensembles ordonnés de p éléments (p < n)? Cenombre-là 
est égal au cardinal de l’ensemble f des applications 
injectives d'un ensemble E de p éléments dans un ensemble 
F à n éléments (schéma ci-dessous). 
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Soit ae E. Son image par une injection peut prendre 
n valeurs. Une fois une valeur choisie, un deuxième 
élément a a, quant à lui, le choix entre n — 1 valeurs 
(la valeur prise par a lui est interdite puisque l'application 
est injective). Pour les deux premiers éléments, il y a 
n (n—1) possibilités, et ainsi de suite. Au bout du 
compte, nous obtenons 


AD = (n—1) (n— 2) (n—p + 41): 


Ce nombre s'appelle nombre d'arrangements de n élé- 
ments D à D. 

Lorsque p — n, l'on obtient le nombre de bijections 
d'un ensemble E sur lui-même. Ce nombre, que l'on 
nomme « factorielle n », se note n!. 


LARSEXASR XX N 
On convient en outre d'écrire : 1! — 


nl=A 


Exemple 2 — Combinaisons 

Si l'on convient d'identifier les arrangements qui dif- 
fèrent seulement par l'ordre des p éléments, on obtient 
l'ensemble des combinaisons de 7 éléments p à p. 
Cela revient à définir sur l'ensemble f une relation d'équi- 
valence R : on dira que /Ri si, et seulement si 
Î(E) = /’ (E). Le nombre de combinaisons est égal alors 
au cardinal de l’ensemble quotient 4/R. Toutes les classes 
d'équivalence de la relation R contiennent p ! injections : 
toute partie 6 de F de n éléments définit une classe d'équi- 
valence A6 = {j | { (E) — 6}. A6 est donc l'ensemble 
des bijections de E —6, donc card A8 = pl, donc 


card F/R — = Ÿ ; le nombre se note CZ (ou (2) : 
ce = Er 1) (a—p +1) | n! 
p! pl(n—p)! 


on démontre les deux égalités : (1) C? = Cr? 


HR UICLEE 


(2) (os 7 Cri nl 


Enfin le binôme de Newton (1 — x)” se développe de 
la manière suivante : 


(+ x)? =7- nx 


2 ,2 3 ,3 ñ 
CR x + Ce x six 


E LE 2 
Cxr- 


Les coefficients du développement peuvent être réunis 
dans un tableau (triangle de Pascal) que l'on construit 
à l'aide de l'égalité (2) : 


Richard Colin 


i(d)i(e) i(f) 
ejleje 


Richard Colin 


e s 9 1 
pe, PO 2 
Fe CORSA. 


Erich Hartmann - Magnum 


Un petit dessin vaut mieux qu'un 


LES G RAPH ES grand discours. NAPOLEON 


Dans la vie courante, nous sommes souvent amenés à 
représenter des situations ou des problèmes par des 
schémas comportant des points reliés par des flèches : 
ainsi en est-il d'une carte routière, d'un réseau électrique 
ou de l'organigramme des services d'une firme. A l'évi- 
dence, ce mode de représentation possède, dans le 
domaine industriel, militaire ou domestique, des vertus 
pratiques et pédagogiques incontestables; plus encore, 
on s'est rendu compte qu'il pouvait faciliter la résolution 
de certains problèmes : en 1736, Euler étudia comment 
il était possible de parcourir les sept ponts de la ville de 
Kænigsberg sans franchir deux fois le même. En montrant 
l'impossibilité du problème, il dégagea les premiers élé- 
ments de ce qui constitue aujourd'hui la théorie des 
graphes. Pour parler néanmoins de la théorie des graphes, 
il faudra attendre le XX® siècle, le développement de la 
théorie des ensembles et la systématisation de la démarche 
axiomatique : deux ouvrages fondamentaux doivent à 
cet égard être mentionnés : celui de D. Kœnig (Leipzig, 
1936) et celui de C. Bergé (Paris, 1957). 

La théorie des graphes constitue une des branches des 
mathématiques les plus florissantes : elle suscite l'inté- 
rêt de nombreux mathématiciens : il existe en effet beau- 
coup de conjectures non démontrées (dont la résolution 
semble d'autant plus délicate que l'énoncé est simple), 
et chaque année voit arriver une moisson abondante et 
internationale de résultats qui tentent de les résoudre. 

Par ailleurs, la théorie des graphes a largement débordé 
sur d'autres branches des mathématiques. On en étudie 
aussi les applications aux groupes finis, aux catégories, 
ou en topologie. Les graphes ont aussi donné naissance à 
un grand nombre d'applications en recherche opéra- 
tionnelle : les problèmes de transport, d'ordonnancement 
des tâches, de planning, de stocks, sont traités désormais 
à l’aide de méthodes et d’algorithmes (non combinatoires) 
qui en sont directement issus (algorithme du flot maximal 
de Ford et Fulkerson, méthode P.E.R.T. etc.). Là 
encore, les progrès réalisés au cours des vingt dernières 
années ont été importants, suscités par l'émergence des 
problèmes d'organisation et de planification qui se posent 
actuellement aux vastes structures administratives et 
industrielles, rendus possibles par le développement des 
ordinateurs et de l'informatique. 


Définitions et propriétés générales 


On appelle graphe le couple G — (X, U) formé par un 
ensemble fini X d'éléments appelés « sommets » et par 
une famille U de couples de sommets que l'on convient 
d'appeler « arcs ». 


X = Xi Xs; sc Xn) 
Ü = {u1, U2, …, Um} 
UEX x X 


Un graphe est en général orienté : c'est-à-dire que l'on 
distingue l'arc (x; x;) de l'arc (x;, x); on suppose ici 
qu'entre deux sommets x;, x; il existe au plus un arc 
(x, x;). Si l'on ne tient pas compte de l'orientation des 
arcs, on parlera de graphe simple (et d'arêtes plutôt que 
d'arcs). On peut ainsi définir un graphe par G = (X, l') 
où l'est une multiapplication X = X (c'est-à-dire une 
application de X = Ÿ (X)). Il est clair que U est alors le 
« graphe », au sens usuel de l'analyse, de L': 


U={(xy)|xex.yeT (x)} 


À La théorie des graphes 

a donné naissance 

à un grand nombre 
d'applications en echerche 
opérationnelle comme, 
notamment ici, 

la planification 

de l'écoulement 

de la production 

d'une firme automobile. 


Exemple : 
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le graphe comporte 6 sommets et 9 arcs (il n'est pas 
connexe). 
X — {x1, X2, X8, Xa, X5, X6} 
U = {(x1, xo), (x2, x1), (xa, x3), (x2, X5), (xs, Xe), 


(xs, xs), (x, Xe), (x3, x3), (X5, xa)} 
(ou U = {uz, u2, Us, …, Uo}). 


Un arc tel que (x3, xs) s'appelle une boucle. 
Matrice boolienne d'un graphe 
Il s’agit d'une matrice &;; carrée d'ordre n définie par 


ai = 1 si (x, x)eU 
= 0, sinon. 
La matrice du graphe donné en exemple est : 
123456 
1 010000 
2 100000 
3 001011 
4 001010 
5 000101 
6 000000 
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> Exemple schématique 
d'un réseau de transport. 


L'indice de ligne correspond au sommet d'origine, 
l'indice de colonne au sommet extrémité. 


Quelques définitions 

Considérons un arc (x, x;). Si x; est appelé extrémité 
initiale, x; extrémité finale, x; est le prédécesseur de 
x, xXj le successeur de x;. Deux arcs seront dits adjacents 
s'ils ont une extrémité commune (par exemple (x4, x5) 
et (xs, xs)). Deux sommets sont dits adjacents s'ils sont 
distincts et reliés par un arc. 

Un chemin est une suite ordonnée d'arcs tels que 
l'extrémité finale de chaque arc coïncide avec l'extrémité 
initiale du suivant; exemple : (x4, x3) ; (xa, x5) ; (x5, X6). 

Un circuit est un chemin dont le sommet initial 
coïncide avec le sommet terminal ; exemple : 

(xa, X3) ; (x3, X5) ; (xs, xa). 

Une chaîne est une suite ordonnée d'arcs adjacents; 
exemple : (x3, x6) ; (x3, X3): (x4, x3) (ou d'arêtes dans un 
graphe simple). 

Un cycle est une chaîne fermée; exemple : 


(xs, x6) ; (xs, X5) ; (xs, Xe). 


On imposera de plus qu'il n'utilise pas deux fois le même 
arc. 

Soit À une partie de X. On notera w* (A) (respective- 
ment «7 (A)) l'ensemble des arcs ayant l'extrémité 
initiale (seulement) dans A (respectivement : extrémité 
finale). 


oT (A) = {(x, x) | x € À, x; € A} 
&7 (A) = {(xi, x) | x É À, x; € A} 
& (A) = w* (A) U &- (A) 


par exemple : si À = {x4, x3} 
wo (A) = {ua, us, U6} et 7 (A) = {us} 


Recherche d'un flot maximal dans un réseau de 
transport 


Un réseau de transport est un graphe particulier qui 
permet de représenter certains problèmes pratiques (pro- 
blèmes de transports, d'affectation des tâches). Un réseau 
de transport est un graphe G = (X, U) tel que: 

— il existe un sommet unique xo (appelé l'entrée 
du réseau) qui n'a pas de prédécesseur; 

— il existe un sommet unique x, (la sortie) qui 
n'a pas de successeur; 

— à chaque arc est associé un nombre appelé sa capa- 
cité. On notera C;; ou C; la capacité de l'arc ux — (xi, xj); 

— on supposera, pour simplifier, qu'entre deux 
sommets x;, x; du graphe, il existe au plus un arc. 


Exemple d'un réseau de transport 


Un réseau est donc à l’image d'un réseau électrique 
reliant une entrée (pôle + d’un accumulateur) à une sortie 
(pôle —). Chaque arc comporte des résistances, des 
capacités, des selfs, et l’on peut chercher à déterminer 
le flux de courant traversant le réseau, sachant qu'il n'y a 
pas d'accumulation d'électricité en un sommet autre que 
Xo et x2 : la quantité d'électricité qui arrive en un sommet 
doit être égale à celle qui en part (loi de Kirchhoff); 
d'autre part, la quantité s'écoulant dans un arc est au 
plus égale à la capacité dudit arc. 
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On définit donc ainsi un flot dans un réseau : on appelle 
a 
flot ® dans un réseau (X, U) possédant m arcs, un en- 


semble de nombres o — (91, p2, …, om), le nombre ox 
étant associé à l'arc k, tels que : 

(i) Ok = ox Pour xj E X — {x0, xn} 
kEw-{x} KEoT{x;} 

0 < ox < Cr VE =, 2, .5m 


La quantité de flot entrant dans les réseaux est égale à 


Pk 
KE © + (xo) 


elle est évidemment égale à la quantité qui en sort: 


Px 


PE — 
kE w* (x) KE &7 (xm) 


la valeur commune à ces deux expressions est appelée 
valeur du flot dans le réseau. 


Problème du flot maximal 


Trouver dans le réseau G = (X, U) le flot de valeur D* 
maximale. 


Algorithme de Ford et Fulkerson de recherches 
d'un flot maximal dans un réseau 


La méthode est une méthode itérative : on suppose que 
l'on connaît un flot, et on cherche à l'améliorer. Lors de 


la j-ième itération, on détermine un flot ou) = 90-12 + EC) ; 
la procédure s'arrête lorsque l'on ne peut plus faire aug- 
menter la valeur du flot. La méthode est une méthode 
matricielle, dont voici le principe appliqué à l'exemple 
donné ci-dessus. Nous représentons ce réseau par sa 
matrice des capacités : il s’agit d'une matrice carrée 
(n, n) {Ci} où C;; représente la capacité de l'arc (x, xj) : 
si l'arc (x, x;) n'existe pas, on pose par convention C;;= 0. 


> Pa 
On part avec un flux initial (0) — 0. Comment l'amé- 
liorer ? On voit que l'on peut passer de Xo — x1 —> x3 — X5. 
1re jtération 
AU maximum, on fait passer 4 unités de xo > x5 par 
ce chemin. 


On pose ®4) — 4 et pre) = (4,0, 4, 0, 0, O, O, 4). 
On va donc modifier la matrice de manière à tenir 


compte du passage de flot 90 [voir M()]. Les capacités 
des arcs (xo, x1), (x1, x3) et (xs, x5) deviennent nulles. 
Par contre, celles des arcs (x1, xo), (xs, x1) et (xs, x3) 
deviennent égales à 4. (En effet, on peut admettre que 
l'on peut faire remonter une unité de x1 à xo en en retenant 
une de celles qui passent de xo à x1.) 


2e itération 
On poursuit la même procédure : il est possible d'aug- 
> 
menter la valeur du flot o4) en empruntant le chemin 
(xo, x2, X4, x5). Sur la matrice MG), on voit que l'on peut 
faire passer au plus 2 unités. On obtient alors le flux : 


% 
@® = (4,2,4,0, 0, 2,2,4) 
et D(2) — 4 + 2 — 6. Les capacités des arcs 
(Xo, x2) (x2, x4) et (x4, x5) 
deviennent alors (4,0,0), celles de (x2, xo), (x4, x2) 
et (xs, xa) : (2,2, 2). 


3° itération 
On augmentera le flot en suivant le « chemin » 
(Xo, X2, X3, X1, X4, X5) 
l'arc (xs, x1) n'existe pas, mais il est possible d'augmenter 
néanmoins le flot en détournant une unité qui va de 
X1 à x3 vers x4. Compte tenu des capacités, on voit que le 
flux est amélioré de la sorte de 2 unités 


e 

o(@) = (4, 4,2,2,2,2,4,4) 

D3—8 

Si l'on cherche à poursuivre la procédure, on ne par- 
viendra pas à trouver un chemin composé d'arcs de 
capacités non nulles grâce auquel l'on puisse atteindre 
ea a + 
X5. Donc o* = 60%); D* — 8. On remarquera que le flot o* 
s'obtient en faisant la différence des matrices M(0) _ MG), 


> 
Ford et Fulkerson ont montré que le flot o* obtenu par 
cette méthode est un flot maximal. 
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Théorème de dualité - Maxflow - Min cut 


Ce théorème (1957) apporte une intéressante caracté- 
risation d'un flot optimal : soit A € X tel que xo É et xn EA, 
l'ensemble w- (A) est appelé une coupe de capacité 


> Cx. Dans l'exemple précédent, avec 
KE w- (A) 
A = {x3, x5, Xn}, on a Ca = 8. Le théorème s'énonce sous 
la forme suivante : Dans un réseau de transport, la 
valeur maximale d'un flot est égale à la capacité minimale 
d'une coupe. Dans l'exemple, D* = C4 et toute coupe 
du graphe a une capacité supérieure à celle de A. 


Chemins critiques — Méthode P.E.R.T. 


Considérons un entrepreneur chargé de construire une 
maison. || s'agit d'un projet dont la réalisation nécessite 
l'accomplissement de plusieurs opérations (ou tâches) : 
creusage des fondations, 
construction du gros œuvre, 
mise en place de l'installation électrique, 
du chauffage, 
réalisation des peintures extérieures, 
des peintures intérieures. 

Toutes ces opérations sont soumises à certaines 
contraintes temporelles : par exemple, les fondations 
doivent être terminées avant de commencer le gros œuvre: 
il est nécessaire d'avoir fini de monter le circuit électrique 
avant de commencer les peintures intérieures. Par contre, 
il est possible de réaliser simultanément les peintures exté- 
rieures et l'installation du chauffage. On représente 
l'ensemble des travaux par un graphe construit ainsi : 

— à chaque opération est associé un arc; 


Ca = 


UUUUU 


AnmOOw» 


— les sommets du graphe correspondent à des 
étapes marquant le début de certaines opérations et la 
fin d’autres; 

— il existe un sommet « début des travaux » et un 
sommet « fin des travaux ». 

L'exemple précédent peut se représenter ainsi : 
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Xo = début des travaux 

X1 = début du gros œuvre 

X2 — début de l'installation de l'électricité 
X3 = début de l'installation du chauffage 
X1 = début des peintures extérieures 

X5 = début des peintures intérieures 

X6 = fin des travaux. 
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<« La matrice MO) indique 
les capacités réelles 

du réseau, sachant 

que le flot 5%) y circule. 
Les O (ou les e) indiquent 
des arcs qui, soit ne sont 
Pas parcourus par le flot, 
soit sont saturés par 
celui-ci. Lorsque, au cours 
d'une itération, l’on sature 
un arc [par exemple 

l'arc (x1, X4), ou 

le troisième] cela revient 
à admettre que l'on a 
augmenté la capacité 

de l'arc contraire (x4, X1): 
ce que l'on indique 

sur la matrice de l'itération. 


< Graphe représentant 
l'ensemble des travaux 
entrepris lors de la 
construction d’une maison. 


— 
© 
e) 
® 
& 
<= 
2 
Œ 


À Polyèdre à 12 faces 
pentagonales et à 

20 sommets illustrant 
l'exemple du jeu 
hamiltonien (voir texte). 


La durée de chaque tâche est évaluée préalablement 
et figure sur le graphe (en jours). Attribuons à xo la date O. 
Nous cherchons à évaluer la date à laquelle seront achevés 
les travaux : pour cela nous déterminons, par chaque tâche, 
la date au plus tôt à laquelle elle peut être réalisée, compte 
tenu de ses relations d'antériorité. 

Soit #:; la durée de la tâche (x, x;). On calcule, pour 
chaque sommet x, la date t;, date au plus tôt à laquelle 
on doit être en x;. On calcule les #; de proche en proche 
en partant de xo (fo — 0) par la formule 


tb = max (tn + tj) Vh | (x, x) E @7 (x). 


Dans l'exemple to — 0, t1 = 40, t2 = 80, t3 


ts = max {ts + 10, to + 7} = 96, 
ts — max {ts + 5,4 + 3} — 100. 


En effet, on ne peut réaliser la tâche (xs, xe) avant que la 
plus longue des deux tâches précédentes (x2, x5) et 
(xs, X5) ne soit terminée. Il est clair que la durée totale de 
la construction est donnée par des 


t = 100. 


Pour que la durée totale ne dépasse pas 100, il faut ne 
pas commencer les peintures intérieures après 


t5 — 100 — 5 = 95 

ni les peintures extérieures après ti = 100 — 3 = 97. 
On détermine ainsi la date au plus tard de réalisation des 
tâches : 
15 = 95—7 = 88, 13 — 95 — 10 — 85, 

ti = min {88 — 40, 85 — 45, 97 — 50} — 40, tj = 0. 
En effet, il ne faut pas terminer la tâche (xo, x1) après 
40 jours, sinon la durée totale de la construction dépas- 


sera 100 jours : on calcule ainsi les t; de proche en proche 
en partant de x» (avec tr — 100) par la formule : 


5 gs (tn — ti) Vh | (ai, ar) € &7 (ai). 


85, t4 = 90, 


(ES 


Recherche du chemin critique 


Le chemin critique est formé des sommets pour les- 
quels il y a coïncidence de leur date au plus tard et de 
leur date au plus tôt : & = t; < x; appartient au chemin 
critique. 

Ces étapes sont à surveiller étroitement : elles sont 
critiques dans la mesure où le moindre retard les affectant 
contribue à dépasser la durée totale du projet. Dans 
l'exemple, le chemin critique est : 


(Xo. X1, X3, X5, X6) 


% intervalle de flottement (tf —t;) d'une étape x: 
il est nul par les tâches critiques; 

% marge totale de la tâche (xi, x) : à partir de la 
date #;, on peut retarder le début de la tâche (x, x;) 
de tŸ —t;—t;; sans augmenter la durée totale des tra- 
vaux. 

L'intérêt de la méthode P. E. R. T. (Program Evalua- 
tion Research Task) réside en ce qu’elle permet de déter- 
miner les tâches critiques. Il est alors possible de chercher 
à diminuer la durée totale du projet en tentant de décom- 
poser les tâches critiques en opérations dont certaines 
pourront être réalisées simultanément avec d'autres 
tâches. Dans l'exemple, si on sépare la tâche « chauffage » 
en deux opérations : pose des radiateurs et des tuyaux 
d’une part, et construction de la cave, pose de la chaudière 
d'autre part (tâches (x1, xs) et (x1, x3)), on obtient un 
nouveau graphe, ci-dessous, (sachantquel'on peut réaliser 
les peintures intérieures, dès que les radiateurs et les tuyaux 
sont posés) : 
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La durée totale du projet a été réduite à 95 jours. Men- 
tionnons enfin qu'il existe d'autres méthodes pour déter- 
miner le chemin critique d'un graphe : la méthode des 
potentiels, qui ne nécessite pas le tracé du graphe, ou bien 
encore la méthode de Bellman qui repose sur la technique 
et les principes de la programmation dynamique. 


Problèmes hamiltoniens 


Soit G— (X, U) un graphe comprenant 7 sommets. 
On dit qu'un chemin u = [x1, x2, …, Xh] est hamiltonien 
s'il passe une fois et une seule par chaque sommet du 
graphe. De même, on dira qu'un circuit u = [x1, x2, …, x1] 
est hamiltonien s’il passe une fois et une seule par chaque 
sommet du graphe. Dans un graphe simple, on définit 
de même une chaîne hamiltonienne ou un cycle hamil- 
tonien. 

Exemple : W. Hamilton proposa en 1859 le jeu sui- 
vant : soit 20 villes réparties sur le globe terrestre : 
a, b, c, …, t que l’on représente pour simplifier par les 
sommets d’un dodécaèdre régulier (polyèdre à 12 faces 
pentagonales et à 20 sommets). On se propose de passer 
une fois et une seule par chacune de ces villes et de revenir 
à son point de départ en utilisant les seules arêtes du 
dodécaèdre. Ce jeu revient à chercher un cycle hamilto- 
nien par le graphe de la figure ci-contre dans la marge (le 
problème étudié par Euler dans les 7 ponts de Kœnigsberg 
est un problème analogue). 

En recherche opérationnelle, on est souvent amené à 
résoudre des problèmes d'ordonnancement : un certain 
nombre de tâches sont à réaliser : on construit alors le 
graphe dont les sommets représentent les tâches : deux 
sommets x; et x; sont alors reliés par un arc s'il est pos- 
sible de réaliser x; avant x;. Un ordonnancement des tâches 
est ainsi représenté par un chemin hamiltonien. La recher- 
che d'un tel chemin (d'un circuit, d'une chaîne ou d'un 
cycle) est ce que l'on appelle un problème hamiltonien. 

Nous nous restreindrons ici à l'étude des cycles hamil- 
toniens dans un graphe simple. Il s'agit à ce jour d'un 
problème ouvert puisque l'on n'a pas encore réussi à 
trouver des conditions nécessaires et suffisantes d'exis- 
tence d’un cycle hamiltonien. L'on ne possède que des 
conditions suffisantes qui toutes procèdent de la remar- 
que suivante : soit x un sommet d'un graphe, on appelle 
degré (et on note d'(x)) le nombre d'arcs incidents 
(intérieurement et extérieurement) au sommet x. Il 
semble intuitif que, plus les degrés sont élevés, plus y il a 
de chances pour que le graphe admette un cycle hamil- 
tonien. Depuis Dirac (1952), on a vu apparaître dans la 
littérature plusieurs théorèmes d'existence utilisant 
la séquence des degrés de tous les sommets du graphe. 

Le théorème le plus récent et en un certain sens le plus 
général (c'est-à-dire qui réduit tous les précédents à des 
corollaires) date de 1971 et est dû au mathématicien 
V. Chvätal. 


Théorème de Chvâtal 
Soit un graphe simple G à n sommets, n > 3, dont 
la suite des degrés rangés par ordre non décroissant 


goes TR n 
… < dn vérifie la propriété : pour tout k < = 


di < d2 < 5 


on a l'implication suivante : 
de <k=> dn-r>n—K. 


Alors le graphe G admet un cycle hamiltonien. 

Les deux théorèmes suivants sont antérieurs à celui 
de Chvétal. Ils s'en déduisent désormais très facilement. 
Théorème d’Ore (1960) 


Soit G un graphe simple, à n sommets (n > 3). 
Si pour tout couple de sommets (x, y) non adjacents on a: 


d(x)—d(y)>n, 
alors le graphe admet un cycle hamiltonien. 
En effet, rangeons les sommets par ordre de degrés non 


ï : ' us n 
décroissants. Si un point xx vérifie dx = d'(xx) < K < 5 


alors xx possède au plus # voisins, et il y a donc n —Kk 
sommets non adjacents à xx dont le degré est, d'après 
l'hypothèse, supérieur ou égal à n — k, soit : 


da-r>n—Kk. 


D'où le résultat en appliquant le théorème de Chvätal. 


Théorème de Dirac (1952) 
Soit G un graphe à n sommets, n > 3, tel que pour tout 


sommet x d(x) >5 alors ce graphe admet un cycle 


hamiltonien. Ceci découle du théorème d'Ore. 


Autres problèmes — autres méthodes 


Conjecture des quatre couleurs 

Est-il possible de colorier toute carte de géographie 
avec quatre couleurs, de sorte que deux régions ayant 
une ligne de frontière commune soient de différentes cou- 
leurs ? Ce problème célèbre n’a toujours pas reçu de solu- 
tion, mais il a suscité l'intérêt des mathématiciens. En fait, 
il s'agit d'un problème de graphe que l'on peut formuler 
ainsi : on appelle nombre chromatique d'un graphe G 
le plus petit nombre de couleurs nécessaires pour colorier 
les sommets de sorte que deux sommets adjacents dis- 
tincts ne soient pas de même couleur. On le désigne par 
y (G). Un graphe planaire est un graphe que l'on peut 
représenter sur un plan sans que deux arcs quelconques 
puissent se couper ailleurs qu'en un sommet. 

Il existe de très nombreux travaux sur le sujet depuis 
1875. Mentionnons les résultats les plus récents : 

e Un graphe planaire qui ne contient pas de cycles 
de longueur 3 est coloriable avec trois couleurs (Grün- 
baum 1963). 

e Si G est un graphe planaire, alors y (G) < 4. 


Noyau d'un graphe 


Soit un graphe G (X, l'), on dit qu'un sous-ensemble 
S & X est un noyau s'il vérifie les deux propriétés : 


(1) xes T(HNS=5S 
(2) xéS T(HNSZ£S 


ce graphe (ci-dessous) admet deux noyaux {a, c}et{b, d}. 
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Un graphe peut représenter un ordre partiel sur X, 
x<yæyeTr (x) 


S est donc alors un ensemble d'éléments non comparables 
entre eux tels que tout élément pris en dehors soit pré- 
féré par au moins un élément des. 

Cette notion permet de résoudre certains jeux (jeux dits 
de Nim), notamment le jeu popularisé par le film d'A. Res- 
nais l'Année dernière à Marienbad. En associant à ce jeu 
un certain graphe, on montre que le joueur qui gagne est 
celui qui parvient à être une fois dans le noyau et à y 
revenir à chaque fois (c'est pour cela que celui qui 
joue en second peut gagner). 


BIBLIOGRAPHIE 


BERGE C., Graphes et Hypergraphes, Dunod, 1973. 
- FORD L.R. et FULKERSON D.R. Flow in Networks, 
Princeton Press, 1962; traduction française, Gauthier- 
Villars, 1967. - KAUFMAN A, /ntroduction à la combi- 
natoire en vue des applications, Dunod, 1969. - ROY B. 
Algèbre moderne et Théorie des graphes, t. 1 et t. 2, 
Dunod, 1970. - SACHE A, /a Théorie des graphes, 
« Que sais-je ? », P.U.F., 1974. 


ALGÈBRE LINÉAIRE 


L'algèbre linéaire est, dans le cadre actuel de son déve- 
loppement, une synthèse de plusieurs courants. Dans des 
domaines aussi divers que le calcul sur les nombres, la 
résolution des équations, les problèmes de géométrie 
classique (à résoudre tant par des méthodes synthétiques 
qu'analytiques), les équations différentielles, etc., tous 
les mathématiciens ont eu à traiter des problèmes linéaires 
et ont contribué à l'évolution de la méthode mathématique 
vers ce que l’on peut appeler la pensée linéaire. 

Car il s’agit bien d'une forme de pensée mathématique, 
et il est clair maintenant que le concept de linéarisation 
d'un problème est très fécond. Les propriétés abondantes 
et des plus diversifiées que l’on peut trouver pour tout ce 
qui satisfait au cadre linéaire donnent à toute approxi- 
mation de cette forme un très grand intérêt. 

I faut voir que cette notion est des plus anciennes et que, 
depuis la règle de trois jusqu'à la géométrie différentielle, 
en passant par la linéarisation de la théorie de Galois ou 
même l'étude des fonctions elliptiques, on a toujours 
— plus où moins consciemment — résolu des problèmes 
linéaires. 

On peut mentionner que les applications couvrent tous 
les domaines. 


61 


À Représentation à trois 
dimensions d'un solide 
à quatre dimensions. 
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> Figure 1 — dans ces 
trois dessins, on montre 
successivement : a, un 
système générateur 

de 2 éléments pour R 
(espace vectoriel 

sur lui-même); 

b, un système générateur 
de 3 éléments pour R? 
(espace vectoriel sur R); 
c, un système générateur 
de 3 éléments pour R° 
(espace vectoriel sur R). 


— Sur le plan local, car, depuis l’idée classique de la 
pente de la tangente à une courbe, égale à la valeur de la 
dérivée, jusqu'à la notion d'application linéaire dérivée 
dans un espace de Banach, on a approximé une fonction 
par une application linéaire ou affine (ainsi encore des 
courbes définies comme enveloppes de leurs tangentes). 

— Surle plan global, car on cherche souvent à mettre 
un problème dans un cadre linéaire : c'est par exemple la 
notion moderne de distribution qui généralise celle de 
fonction, ou mieux encore celle de mesure. 

De Grassmann (1809-1877) à Hilbert (1862-1943), 
de nombreux mathématiciens ont contribué à l'élaboration 
formelle de ce puissant outil. On peut ainsi citer : Môbius 
(1790-1868), Hamilton (1805-1865), Sylvester (1814- 
1897), Weierstrass (1815-1897), Cayley (1821-1895), 
Hermite (1822-1901), Kronecker (1823-1891), Lie 
(1842-1899), et bien d'autres encore. 


Description d'un espace vectoriel — Bases 


La structure d'un espace vectoriel est déterminée par 
les opérations que l'on peut réaliser sur ses éléments, 
c'est-à-dire le produit par un élément du corps de base 
(scalaire) et l'addition. L'associativité de l'addition permet 
de combiner encore plus globalement les éléments d'un 
espace vectoriel E par l'intermédiaire d'éléments du corps 
de base K. Soit (ny en une suite d'éléments de E; 


on appelle combinaison linéaire des xA toute expression 


de la forme Li ïn Xn OÙ an € K, et telle que seulement 
neN 

un nombre fini des x, soit différent de zéro. Dans ce cas, 
on a en fait une somme finie de termes, tous éléments de E. 
Le résultat a donc bien un sens et est un élément de E 
Notre propos, maintenant, va être de montrer comment il 
est possible de décrire tous les éléments de E — et « aux 
moindres frais » (c’est-à-dire avec le minimum de choses 
données a priori) — par cette construction, grâce à la 
structure d'espace vectoriel sur E. 

Soit donc un ensemble d'éléments de E appelé S. On 
désigne par {S} l'ensemble des combinaisons linéaires 
d'éléments de S (il faut bien noter que, même si S ne 
contient qu'un nombre fini d'éléments, {S} peut être infini 
même non dénombrable dès lors que Card K n'est pas 
fini), qui est bien évidemment un sous-espace vectoriel 
de E : on dit que S engendre {S}. On peut remarquer que 
{S} est le plus petit des sous-espaces vectoriels de E 
qui contiennent S. Dans le cas où {S} = E, on dit que S 
est un système de générateurs de E, ou que E est engendré 
par S (fig. 1). 
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D'autre part, il est clair que si l'on ajoute à S des élé- 
ments qui sont combinaisons linéaires d'éléments deS, 
on ne modifie pas {S}. Un système générateur de E reste 
donc générateur si on le complète par d'autres éléments 
de E. La question est alors de savoir s'il est possible d'en 
enlever mais tout en laissant à S son caractère générateur; 
elle est déjà presque résolue d'après ce que nous avons 
déjà dit puisqu'un élément « semble être en trop » dans S 
s'il est combinaison linéaire d’autres éléments de S. 

On définit alors un système libre ou indépendant linéai- 
rement comme un système tel que la seule combinaison 
linéaire de ses éléments qui soit nulle soit celle où tous 
les scalaires sont nuls; soit : 


d1X1 + G2X2 + + ApXp > U1= A2 = … = Up = 0 


Dans le cas contraire — le système est dit //é ou /inéai- 
rement dépendant — on aurait une combinaison linéaire 
nulle : 


%1X1 + A2X2 — Xp Xp = 0 


où l’un, au moins, des «; serait non nul, soit par exemple «x, 
et l’on pourrait écrire : 
— 7 
XkE = — (oœ1x1 ati 
ak 
dk —1Xk-1 + Ak+1Xk+1 Te + EpXp) 
donc xx serait combinaison linéaire des autres x. 

On doit remarquer tout de suite qu'un système libre 
reste libre si on lui ôte certains de ses éléments, mais par 
contre peut perdre ce caractère si on lui en ajoute. C'est 
donc la situation opposée à celle des systèmes générateurs. 

Si maintenant un système B, libre dans E, est tel que 
{B} — E (donc s'il est générateur aussi), on dit que B 
est une base de E. 

Lorsque l'on peut trouver une famille finie S, géné- 
ratrice de E ({S}— E), on dit que E est de dimension 
finie. Dans le cas contraire, on dit que E est de dimension 
infinie, ce que l’on note dimgE = + ©. 

Il est très facile de montrer que tout espace vectoriel 
de dimension finie admet une base; toutefois ce résultat 
ne peut être étendu au cas de la dimension infinie que 
par une démonstration assez délicate faisant intervenir 
le lemme de Zorn. Ce que l'on voit déjà, c'est qu'une 
base de E contient au moins autant d'éléments que 
n'importe quel système libre, et n'en contient pas plus 
qu'un quelconque système générateur. C'est bien là 
le compromis du « descriptif aux moindres frais » qui 
était cherché. 

De cette propriété découle le fait que deux bases quel- 
conques d'un même espace vectoriel E, de dimension 
finie, ont le même nombre d'éléments. C'est ce nombre 
que l’on appelle la dimension de E, notée dimkE (cette 
notation, qui précise le corps de base de E, se simplifie 
en dim E lorsque aucune confusion n'est possible, le 
corps K ayant été fixé une fois pour toutes). Pour un 
espace vectoriel de dimension infinie, deux bases quel- 
conques sont équipotentes, c'est-à-dire qu'il existe une 
bijection de l’une sur l’autre. Un exemple simple montre 
l'influence du corps K sur la dimension de E : dans l'es- 
pace vectoriel R? sur le corps R, les deux vecteurs 
ei = (1,0) et e2— (0,1) forment un système libre, 
car la combinaison linéaire 


4161 + X269 = A: (1,0) — 02° (0, 1) = 
(1, 0) + (0, x2) = («1, we) 


ne peut être égale au vecteur nul (0, 0) que si «1 = 2 = 0; 
d'autre part, ils forment un système générateur car, si (x, y) 
est un élément quelconque de R?2, on a bien 


(X, y) = xe1 + yez 


La base ainsi formée est dite base canonique de R? 
et on a dimz R? = 2. Toutefois, on sait que R2 possède 
une structure de corps, donc d'espace vectoriel sur lui- 
même, si l’on y définit le produit : 


(x, 8) - (x, y) = (ax — By, ay + Bx) 


Dans ces conditions, tout vecteur de R? est le produit d'un 
vecteur fixe, à composantes non nulles, de R2 par un élé- 
ment (cette fois pris comme scalaire) de R?. Puisqu'un 
système formé d'un seul vecteur non nul est libre, on en 
déduit que toute base de R?, espace vectoriel sur lui- 
même, est formée par un seul élément et que dimg? R2= 1. 


Les notions de base et de dimension sont donc liées à 
la structure de l'espace vectoriel considéré E (donc entre 
autres au corps de base choisi), et non seulement aux 
éléments, non structurés, de E. La propriété fondamen- 
tale d'une base est donnée par le théorème qui suit. 

Théorème. Pour tout élément x d'un espace vec- 
toriel E sur un corps K, muni d'une base B, il existe une 
et une seule combinaison linéaire d'éléments de B, à 
coefficients dans K, qui soit égale à x. (On dira que tout 
élément de E se décompose de façon unique selon les 
vecteurs de base.) 

En effet, B étant générateur, une telle combinaison 
linéaire existe. D'autre part, s'il en existait deux : 


à ei = x et b5 Ge; = x où seul un nombre fini parmi 
iel iel 

les «; comme parmi les 8; ne sont pas nuls, on pourrait 
écrire : 


O=x—x— 2 (ai — Bi) ei = À yiei 
où seul un nombre fini re coefficients y: un différent de 


zéro. Donc la combinaison linéaire > vie: du système 
el 

libre formé par les vecteurs e;, est nulle; ce qui n'a lieu 

que si tous les termes y; sont nuls. Par conséquent, 

a = B: pour tout /EI. Les deux décompositions ne 

peuvent donc être différentes si B est libre, donc a for- 

tiori si c'est une base. 

Le résultat suivant est couramment utilisé pour cons- 
truire une base. 

Théorème (base incomplète). Soit L un système 
libre de E et G une partie génératrice de E; alors il est pos- 
sible de construire une base de E en « complétant » L par 
une partie de G. 

Il est donc bien clair que, de tout système générateur, 
on peut extraire au moins une base. 

Ce théorème est très aisé à démontrer en dimension 
finie mais le lemme de Zorn est encore une fois nécessaire 
si l'on veut étendre ce résultat au cas de la dimension 
infinie. On en déduit qu'un sous-espace vectoriel V 
d'un espace vectoriel E (sur un corps K) de dimension 
finie est aussi de dimension finie, et l'on a: 


dimx V < 


l'égalité ne peut avoir lieu que si V = E (et l'on pose par 
convention que la dimension de l'espace vectoriel {0} 
est nulle). 

L'intersection de deux sous-espaces vectoriels est 
un sous-espace vectoriel, mais leur réunion n'en est pas 
un en général. Plus exactement, on peut définir le sous- 
espace vectoriel engendré par la réunion de deux sous- 
espaces vectoriels U et V, c'est-à-dire l'ensemble des 
combinaisons linéaires d'éléments appartenant soit à U, 
soit à V. Ce sous-espace se nomme somme de U et V 
et se note U + V (il est bien formé d'éléments de la 
forme u + voù ue U et ve V). Dans le cas particulier 
où U NV = 0, on dit que la somme est directe et l'on 
note U @ V. 

Ainsi, l'intersection dans R3 de deux plans passant 
par l'origine est une droite (s'ils ne sont pas confondus) 
passant par O (fig. 2); l'intersection d'un plan passant 
par O et d’une droite passant par O, non contenue dans ce 
plan, est {O}; si la droite est incluse dans le plan, l'inter- 
section est égale à cette droite (fig. 3). La réunion de deux 
plans, par contre, n'est pas un sous-espace vectoriel. 
Dans R?2, la réunion de deux droites n'est pas un sous- 
espace vectoriel, comme le montre la règle du parallélo- 
gramme (fig. 4). La somme de deux plans sécants de R3 
n'est autre que R3; mais cette somme n'est pas directe. 
La somme d'un plan et d'une droite perpendiculaire à ce 
plan en O (fig. 5) est encore R3, et cette somme est 
directe. 

Dans le cas où E — U @ V, une base de E est formée 
par la réunion d'une base de U et d'une base de V, et si 
la dimension de E est finie, on a : 


dimx E 


dimx E = dimx U + dimx V. 
Cette propriété se généralise par la formule : 
dimx (U + V) = dimr U + dimx V — dim (U N V) 
sur laquelle on ne s'étendra pas ici, mais que l'on peut 
vérifier sur les exemples qui suivent. 
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fig. 3 
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< Figure 2 : intersection (D) 
du plan (P) défini par Ox 
et Oy et d'un plan (P') 
passant par Oz. 


A Figure 3 : intersection 
d'un plan (P) et d'une 
droite (D) — a, (D) non 
contenue dans (P); 

b, (D) contenue dans (P). 


<« Figure 4 : /a règle 

du parallélogramme montre 
que la somme D + D’ est 
distincte de la réunion 

D Ü D”. 


« Figure 5 : l’espace R® 
est obtenu comme somme 
directe du plan (P) 

et de la droite D. 
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Y Figure 6: cf. 
développement dans 
le texte ci-contre. 
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A Le mathématicien anglais 
Arthur Cayley (7821-1895). 


Ainsi, soit P le plan « horizontal » de RG, soit : 
P—{(x y,z)ER3 tels que z = 0} 
et D3 la droite « verticale », soit 
Ds = {(x, y,z) RS tels que x = 0 et y = 0} 


on a bien R3 = P @ D3; en désignant par D1, D, D3 les 
trois axes orthonormés usuels, on a bien P2= D; © D2 
et évidemment R3 — D1 ® D: © D3 (fig. 6). 


R3 = D:@ De @ Da 
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On a jusqu'à présent, dans ce paragraphe, utilisé les 
ensembles R2, R3 et plus généralement R7 comme exem- 
ples. Ce n'est pas le fait d'un simple hasard : pour l'étude 
des espaces vectoriels de dimension finie, ces ensembles 
jouent un rôle fondamental que le résultat qui suit va 


expliciter. 
Théorème. Tout espace vectoriel réel E, de dimen- 
sion finie n, est isomorphe à l'espace vectoriel — sur 
ñn 


Ce résultat fondamental permet de comprendre les 
limites des concepts utilisés selon qu'on s'intéresse à des 
espaces vectoriels de dimension finie ou infinie. Il se 
généralise : tout espace vectoriel E sur un corps K tel que 
dimx E — n est isomorphe à K?. Il provient du fait qu'un 
isomorphisme g d'espaces vectoriels se doit de « retrans- 
crire » les lois additive et multiplicative, soit : 


g (X + Y) = g (X) + g (Y) 
g(a:X) —=a:g (X) 


donc l’image d'un vecteur quelconque de E, par g, est 
connue dès lors que l’on connaît les images des vecteurs 
d’une base donnée de E : si vx, va, …, Vn désigne la base 
5° i=n 
choisie dans E, tout vecteur XE E s'écrit : X = > Vi 
i=1 
et alors 
i=n i=n 
g = D g(auiw)= > «g (w): 


i=1 Fe 
la connaissance de 
{g (v1), g (va), …, g (Vn)} 


permet alors, si l’on se donne «1, œ2, …, an, donc X, de déter- 
miner g (X). Il suffit donc de pouvoir faire se corres- 
pondre, de manière biunivoque, les vecteurs d'une base 
de E et ceux d'une base de R?, ce qui est réalisable puis- 
qu'il y en a n exactement de part et d'autre. 

L'isomorphisme étant une relation d'équivalence, on 
peut écrire : deux espaces vectoriels de même dimension 
sont « identiques, à un isomorphisme près ». Ceci veut dire 
qu'ils sont en fait une seule et même structure d'espace 
vectoriel. 

C'est à H. Grassmann, mathématicien allemand, que 
l'on doit le passage, décisif pour le développement de 
l'algèbre linéaire, des espaces de dimension 1, 2 et 3 
— visualisables — à ceux de dimension n, de façon axio- 
matique claire. 


Applications linéaires 


On vient d'utiliser une application conservant les struc- 
tures (donc un homomorphisme) qui, de plus, était bijec- 
tive. Ce sont ces applications, conservant la structure 
linéaire (en ce sens que l’image d’une combinaison linéaire 
est la combinaison linéaire des images), qui permettent 
de donner un sens global au calcul matriciel tel que Cayley 
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le formula, et à ses développements fondamentaux dus à 
Hermite et à Sylvester. On les appelle applications 
linéaires, et ce sont donc des applications g d'un espace 
vectoriel E dans un espace vectoriel F, sur un même 
corps K, vérifiant : 


g (ax + by) = a g(x) + b g(y) 


pourtous xEeE,yeE,aeKetbeK. 

Quelques idées générales sur ces applications vont 
permettre de les utiliser, pour la résolution des systèmes 
d'équations linéaires entre autres. 

On voit tout d’abord que g (x— x) = g (x) — g (x), 
donc g (0) = 0. Mais il peut exister d'autres éléments de E 
ayant O pour image. L'ensemble de ces éléments est un 
sous-espace vectoriel de E, que l'on appelle noyau de g, 
ce qui se note Ker g (de la racine celtique « kernel »). 
On a toujours 0 € Ker g; si {0} — Ker g, alors g est une 
injection, car, si g (x) = g (y),on a 

g (X—y) = g (x) —g (y) = 0, 
donc x— ye Kerg, d'où x— y = 0, soit x = y. Cette 
propriété, qui permet en fait de « translater » toutes les 
autres, est bien particulière aux applications linéaires. 

Pour étudier si l’on a une surjection, on doit considérer 
l'ensemble des points de F qui sont images d'un élément 
de E au moins. On introduit alors l'ensemble des points- 
images, soit l'image de g, que l'on note Im g, qui est un 
sous-espace vectoriel de F. Ces ensembles, lorsque E est 
de dimension finie, sont liés par la relation fondamentale : 


dimx E — dimx Ker g + dimx Im g. 


En particulier, si g est une application linéaire de E 
dans lui-même (ou endomorphisme), on obtient le 
résultat : 


g injective < g surjective <> g bijective 


que l'on peut même étendre aux applications de E dans F, 
pourvu que les deux espaces vectoriels soient de dimen- 
sions finies. 

Lorsque F — K, on dit que l'on a une forme linéaire; 
ceci a bien un sens puisque K est un espace vectoriel sur 
lui-même. Dans ce cas, le sous-espace Im g est inclus 
dans K: il est donc de dimension 0 ou 1, et le noyau de g, 
si E est de dimension finie, est donc de dimension 7 ou 
n— 1. Dans le premier cas, la forme linéaire est la forme 
nulle (tout vecteur a pour image 0); et dans le second 
cas, on dit que le noyau est un hyperplan. 

L'ensemble des applications linéaires de E dans F est 
un espace vectoriel sur le même corps, lorsqu'on y définit 
les opérations d'addition et de produit par un scalaire 
usuelles :onle note£ (E, F). Lorsque E = F,la composition 
des applications lui donne une structure d'algèbre, et on 
le note £ (E). Enfin, si F — K, on obtient l'ensemble des 
formes linéaires sur E, que l’on nomme dual de E, noté E*. 

On va regarder maintenant comment l'on peut carac- 
tériser un élément quelconque de © (E,F), et l'on s'y 
intéressera plus spécialement pour les espaces vectoriels 
E et F de dimension finie. 

Une base B = {e;hie1 de E étant donnée, tout élément 


xEE possède une décomposition unique x — 2. œiei, 

iel 
selon cette base (et où seul un nombre fini de termes 
ne sont pas nuls). Soit g € £ (E, F), alors, en raison des 
conditions de linéarité de g,on a: 


p C9) = D œi q(ei) 
iel 

La connaissance de x équivaut à celle de la suite 
(œ)ier, donc g (x) sera entièrement connu par la donnée 
de tous les éléments g (e;), images des vecteurs de la 
base B. Ceci revient à dire qu'une application linéaire est 
déterminée totalement par les images des vecteurs d'une 
base de l’espace de départ. De cette idée découle toute 
la théorie des matrices, introduite par Sylvester, et dont 
les développements sont immenses. 


Matrices — Calcul matriciel 


L'utilisation des tableaux rectangulaires de nombres est 
connue depuis très longtemps, et de nos jours, il n'est 
pratiquement pas de domaine (où les nombres jouent un 
rôle) qui neles utilise. Toutefois, ce n’est qu'au XIXF siècle 
que le mathématicien anglais Arthur Cayley précisa la 


notion de matrice comme étant une forme de représen- 
tation, disons un « modèle », pour une transformation 
linéaire. Il en déduisit un exposé clair du calcul matriciel, 
lequel a pour but essentiel de simplifier toutes les écritures 
ayant trait aux opérations sur des applications linéaires. 
Cette justification — sur des bases mathématiques 
claires — de l’utilisation des tableaux de nombres a permis 
tous les plus fructueux développements que l'on connaît 
actuellement. 

Soit deux espaces vectoriels réels ou complexes EetF, 
de dimensions finies n et p (ce que nous supposerons dans 
tout ce paragraphe) ; une base BE — {er, 2, …, en} de E, 
une base Br = {f1, f2, …, fh} de Fetge® (E, F). Alors, 

J=n J=A 
pour tout élément x = hi de, on ao (x) = ï. a; g (ei). 
J=i el 
Puisque g (e;) € F pour toutes les valeurs de /, chacun de 
ces vecteurs possède une décomposition dans la base B : 


i=p 
g (es) = > Bifi 
i=1 
Cette fois, l'écriture comporte deux indices pour mon- 
trer que, pour chaque élément g (e;), il existe une suite 
de p coefficients. On dispose par conséquent de n x p 
nombres réels ou complexes B;; qui définissent entière- 
ment tous les vecteurs g (e1), g (e2), …, g (er), donc 
l'application g elle-même. Très exactement, B;; est la -ième 
composante du vecteur g (e;), c'est-à-dire sa coor- 
donnée selon le vecteur ; de la base Br. Par convention, 
en rangeant colonne par colonne les composantes des 
vecteurs g (e;), on obtient la matrice de l'application g 
relativement aux bases B£ et Br: 


Gui 12 … Bij … Bin 
Ba Bo2 … Bo; … Bon 


Gi  Bie … Biÿ … Bin 
Gp1 Pp2.… Bpi + Bon 
On dit que l’on a une matrice (p, n), ou encore à p lignes 
et n colonnes, et l’on note, en abrégé, cette matrice : 


(n et p sont les dimensions de la matrice). 

Voici quelques matrices remarquables dans le cas 
E—F (les matrices sont alors des matrices carrées), 
on identifiera cet espace vectoriel, grâce à l'isomor- 
phisme vu plus haut, à R? (ou C* dans le cas d'un espace 
vectoriel complexe) muni de sa base canonique. 

La matrice de g : x— 0 est donc (0);=-1,2,...,n 
(matrice nulle). j=12.,n 

La matrice de g : x — x est alors la matrice identité 
où seuls ne sont pas nuls — et valent 1 — les éléments de 
la diagonale, c'est-à-dire ceux pour lesquels les deux 
indices sont égaux. 

La matrice de g:x—>« x, où x est un scalaire, est 
[x © 
(6 +) 

La rotation d'angle 8 autour de l'origine, application 
de R? dans R?, est représentée par la matrice : 


cos 6 —sin 9) 
sin 6 cos 6 
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La rotation d'angle 6, autour de l'axe Oy (fig. 7), ap- 
plication de R3 dans R?, admet pour matrice : 


cos 8 O —sin 8 

( (0) 1 (0) | 

sin 6 O cos 6 

Soit A — (a): = 
ji= 


….» une matrice (p,n) et 
PE 


n 
X = ei xiei € E. 
i=1 
On définit le produit AX pour que le résultat soit l'image 
de X par l'application linéaire : g: E — F dont A est la 
matrice relativement aux bases canoniques. Puisque : 


4 ñ P 
g XD = © xgle), onag (= D x À af 


i=1 i=1 i=1 


d'après la définition d'une matrice. On a donc un vecteur 
à p composantes dont la /-ième (le facteur de f) vaut 
n 


exactement pi xa. Or la j-ième ligne de A s'écrit : 
i=1 

(&15, 825, …, an;), et si l'on définit le produit de cette ligne 

par le vecteur-colonne des x; comme étant égal à : 


X181j + X282j + … + Xnänj 


(somme des produits de termes se correspondant), 
alors le produit de la matrice A (matrice (p, n)) par le 
vecteur-colonne X (ou matrice (n, 1)) est obtenu en 
faisant le produit de chaque ligne de matrice À par le 
vecteur X comme on vient de la définir (et qui n’est que 
la généralisation de la notion classique du produit scalaire 
de deux vecteurs, mais dans R’), et en rangeant les résul- 
tats obtenus en un vecteur-colonne. : 


X1 
X2 
(az 852 ... 8j) ‘ | ajixi+ aj2x2 +... + &nXn 
Xn 
ji=n 
411 ... din X1 D» 41j Xj 
31 
j=n 
421 ... 42n X2 = D 423 Xj 
CS 
j=n 
Ap1 ... Apn Xn Z apj x; 
j=1 


Opérations usuelles 


De façon générale, le calcul matriciel s'obtient en 
« décalquant » sur les matrices telles qu'elles sont défi- 
nies, les opérations usuelles sur les applications, et leurs 
propriétés. 
Posons donc 


deux matrices (p, n). 

On dit qu'elles sont égales si, pour toutes les valeurs de 
et de j, on a : a = bi. En effet, deux applications 
linéaires sont égales si les images des vecteurs de base 
coïincident. 

La somme des deux matrices À et B est la matrice C, 
matrice (7, p), obtenue en faisant la somme des termes 
correspondants de À et B : ci; = ai; + bi; pour toutes 
valeurs de / et dej; si A représente l'application g1 et si B 
représente l'application g2 par rapport à deux bases 
données, alors C — À + B représente g1 + g2 dans ces 
mêmes bases. 

Soit maintenant £e K, un élément du corps de base 
(réel ou complexe). Alors, &A est la représentation de 
l'application kg si l'on pose : 
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<« Figure 7 : rotation 
d'angle 0 autour de l'axe Oy. 


» Figure 8 : rotation 
d'angle 8 autour de 
l'origine O (dans R?) 
composée avec une rotation 
d'angle + autour de O : 

— — 
(OM, OM) = 0 

—> — 
(OM:, OM) = & 

—> — 

(OM, OM) = 8 ++, 


Ces deux opérations donnent à l’ensemble des matrices 
(p, n), à coefficients dans le corps K, une structure d'es- 
pace vectoriel sur K. Cet espace se désigne par AC, » (K); 
il est isomorphe à £ (E, F), et l'on a donc: 


dimx£ (E, F) = dimr A6», » (K) = n X p. 


Toutefois il faut noter que cet isomorphisme dépend étroi- 
tement des bases choisies de E et de F; en ce sens, on 
dit qu'il n'est pas canonique. Cependant c'est un moyen 
bien commode pour identifier les deux ensembles. Une 
application linéaire ne peut donc être associée à une 
matrice que par l'intermédiaire d’une base de chacun des 
espaces vectoriels E et F. On verra justement plus loin 
l'effet d'un changement de base sur une matrice. 


Le produit matriciel 


Soit E, F, G trois espaces vectoriels sur un même 
corps K. Soit g1 EL (E,F) et ge£ (F, G), on sait que 
g20 g1 (x) = g2[g1 (x)] pour xEE; c'est l'opération 
de composition des applications. Le produit matri- 
ciel est une opération entre matrices de telle sorte 
que B : À (si B et À sont respectivement les matrices de 
g2 et g1 relativement à des bases données) soit la matrice 
associée à l'application g20 g1 (par rapport aux bases 
déjà choisies). Les conditions dans lesquelles on peut 
réaliser cette opération sont définies par le fait que F, 
espace d'arrivée pour g1, est aussi l'espace de départ 
pour g2: la dimension de F devra donc être aussi bien 
le nombre de colonnes de B que le nombre de lignes de A. 
D'autre part, sin — dimx E, p — dimx F et g = dimx G, 
alors A est une matrice (p, n), B une matrice (g, p) et C 
(matrice de g2 0 g1) une matrice (g, n). 

D'où la règle suivante : le produit de deux matrices 
B et A n'est réalisable que si le nombre de colonnes de B 
est égal au nombre de lignes de A. Dans ce cas, le produit 
d'une matrice (q, p) par une matrice (p, n) est une matrice 
(g, n). 

Sans chercher à montrer rigoureusement — ce qui 
nécessiterait quelques calculs lourds — la méthode du 
produit matriciel, on la justifie en notant qu'une matrice 
estune collection de vecteurs-colonnes.Il est donc logique 
d’avoir à multiplier la première matrice par chaque colonne 
de la seconde; ceci amène à formuler que le produit de B 
par la première colonne de A donne la première colonne 
de C, et ainsi de suite jusqu'à la dernière colonne de A 
qui donne — par produit avec B — la dernière colonne 
de C. On peut donc énoncer la formule du produit matri- 
ciel : 

k=p 
Ci — ba bixax; = bi181; + bi2a2; + .… — bipar; 
k=1 


Autrement dit, le terme situé à la /-ième ligne et /-ième 
colonne de C = B X A est le produit de la /-ième ligne 
de B par la j-ième colonne de À, au sens déjà défini plus 
haut. 

Cette règle est schématisée ci-dessous : 


(où bia 


a1j 
où Ci = (bi bi .. bip) 2j 


api 
= bi1 815 + biz 825 + .… + bis ar 
Les propriétés suivantes, connues pour les applications 
linéaires, ne surprendront donc pas. 
Propriété 1. Le produit matriciel n’est pas commutatif. 
Il n'est d’ailleurs pas toujours possible de réaliser A x B 
lorsqu'on peut calculer B X A. Cela ne peut se faire que si 
le nombre de colonnes de A est égal au nombre de lignes 
de A et si le nombre de colonnes de B est égal au nombre 
de lignes de A. Donc, si À est une matrice (p, n), il faut 
que B soit une matrice (n, p); alors AB est une matrice 
(p, p) et BA une matrice (n, n), qui ne peuvent être égales 
si n — p. Mais, même si n = p, de toutes façons la com- 
mutativité n’est pas règle mais exception. 
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Propriété 2. Soit In — (di): 


= 1,2,.., n la matrice iden- 
j—1,2 


sens TL 
tité d'ordre n. 
Alors, pour toute matrice A d'ordre », on a: 
A X In = In X À = A. 
En effet, |, correspond à la transformation identité. 
Propriété 3. Le produit matriciel est associatif : 
(AB) C = A (BA) = ABC. 
Propriété 4. Le produit matriciel est distributif par 
rapport à la somme : 
A:(B+C) 
(A+B):C 
et, de plus, pour tout élémentke K,on 
(kKB):C—=Kk(B:C)=B: (kC). 


Propriété 5. Soit Op, n — (0):=1,2,..,9 la matrice 
j=1,2,...,n 


= A: A:C 
= A: B.C 
a: 


nulle de dimensions (p, n). 
Alors, 
pour toute matrice À, de dimension (n, q) : 


Op, n X A = Op, q 
et pour toute matrice B, de dimension (q, p) : 
B x Op, n = Oa, n 


Avant de formuler quelques exemples, notons le cas 
particulier de l'ensemble des matrices carrées d'ordre n, 
soit AC» (K). C'est un espace vectoriel de dimension n?. 
Sur cet ensemble, on peut définir une seconde loi de com- 
position interne : le produit matriciel (de même que sur 
l'ensemble £ (E) on peut définir le produit de composition 
des applications). Chacun des deux ensembles £ (E) et 
AC» (K) est alors muni d’une structure d'algèbre non 
commutative. 

La rotation d'angle 8 autour de l'origine dans R? est 
représentée par la matrice, relativement à la base canoni- 
que, 


cos 6 


M6 = EE — sin o) 


A l’aide des formules de trigonométrie, on peut voir que: 
Mo xX Ms = Mo X Mo = Metro 
ce qui s'explique clairement sur la figure 8. 


On en déduit que Me x M6 = M-6 X M-8 = la. 
Dans cet exemple, il est clair que, pour toute matrice Me, 
il existe une matrice (soit M-o) qui, multipliée par M8, 
donne l'identité : on dit que M-s est la matrice inverse 
de Ma. Toute matrice A € Ar (K) ne possède pas cette 
propriété : en effet, ceci revient à étudier si l'appli- 
cation linéaire f dont A est la matrice — relativement à 
une base donnée — possède une application réciproque ; 
ceci n'a lieu que si f est bijective, ou encore injective 
puisque l’on est en dimension finie. La propriété suivante 
permettra de caractériser les matrices possédant une 
inverse. 

L'application f est injective si, et seulement si, les vec- 
teurs f (ex), f (e2), …, f (en) forment un système libre 
dès que {ez, e2, …, eh} est une base de E. 

Soit en effet S — {f (e1), f (e2), …, f (ex)}, qui est libre 

I=n 
si pi œ f (e;) = © implique que «; = 0 pour toutes les 


i=1 


valeurs de ;. Mais, par linéarité, on a: 


mf(e)= > f(ue)=f 
1 i=1 


INA 


(2e) 


i 


et on sait que : 


X = $ ti e1E€E 


= 


Donc, dire que S est libre, c'est dire que f (X) = 0 
implique X = 0, donc que f est injective. 
Réciproquement, si f est injective, pour tout XEE, 
n 


donc de la forme X — > a e&,onaf (X) = 0 seulement 
i=1 


siX = 0. 
D'autre part, la linéarité de f donne : 


1 as) = b: af (ei). 


i=1 T= 1 
On a donc les implications : 


ro = (S a a) - 
i=1 


n 


D &f(&)=0— 


i=1 


n 
2 &&—=0—=a—0 
É—1 


pour toute valeur de /; la seconde implication étant la trans- 
cription du fait que (e;):=1,2,..., nr est une base, donc un 
système libre. Cette propriété donne le résultat fondamen- 
tal qui suit. 

Théorème. La matrice A € ACx (K) est inversible 
(possède une inverse) si, et seulement si, les Vecteurs- 
colonnes de A forment un système libre. 

On peut remarquer que pour une matrice (2, 2) qui 


sx (a D es 
s'écrit si 4) les vecteurs-colonnes sont linéairement 


indépendants si : 


(): 
œ Gr 
1 C 


soit encore : 


aa +wb\ {0 _ 
(es aa) = (== Se 


(0) 
(G)= == 0 


: . : f 1 a + «2 b = 0 
Or les équations simultanées : luc+æd=0 


” ; .a D 
solution «1 = «2 = 0, unique, sauf si eus g'euquel cas 2 


F Se b 
peut être choisi quelconque et GE 2 «2 dès que 


a Z 0. On reconnaît là la notion de dépendance linéaire 
exprimée sous forme de proportionnalité. 


Rang d'une application linéaire. 

Si la matrice A n'est pas inversible, l'application linéaire f 
à laquelle elle est associée n'est pas bijective, donc pas 
surjective. On pense donc alors à caractériser l'ensemble 
Im, sous-espace vectoriel de F (f:E—F) tel que 
dimx Im f < dim F (sinonimf= F et fserait surjective) 
par sa dimension. Ce nombre, qui est encore le nombre 
maximal de vecteurs-colonnes de A linéairement indé- 
pendants, s'appelle le rang de fet se note rg (f) [fig. 8 bis]. 
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On peut montrer que ce nombre est caractéristique de f, 
et ne dépend pas des bases choisies pour la matrice A. 
Il joue un rôle fondamental dans la théorie des systèmes 
d'équations linéaires. Plus généralement encore, on dit 
quefe£ (E, F) est de rang fini si le sous-espace vectoriel 
Im f est de dimension finie (ce, pour le cas où E et F sont 
de dimensions quelconques). Bien évidemment, pour 
une matrice carrée À inversible, on a rg À = dim E. 

Pour illustrer ces notions, on considère l'exemple sui- 
vant : 

soit E = R3 et F — R? (géométriquement représen- 
tés par l'espace à 3 dimensions, et le plan « horizontal » 
des deux premières coordonnées) et l'application 
f: R3 — R? définie en tout point par : f (x, y, z) = (x, O). 
Cette application (fig. 9) n’est autre que la projection sur le 
premier axe de R?; elle n'est pas surjective puisque les 
images ont concentrées seulement sur le premier axe 
du plan. L'ensemble Im f est donc très exactement cette 
droite; il est donc de dimension 1. On peut noter que 
l'ensemble Ker f est défini par les points (0, y, z) où yetz 
sont quelconques, car f (0, y, z) — (0, 0). Cet ensemble 
est donc le plan yOz défini par le second et le troisième 
axes de R3. On aurait pu aussi directement voir que la 
matrice de f relativement aux bases canoniques de R2 


et R3 s'écrit ( : 6) et que le seul système libre parmi les 


vecteurs-colonnes est formé par le premier. 


Changement de base 

Pour finir cette brève présentation des outils du calcul 
matriciel, on va étudier l'effet d’un changement de base 
sur une matrice carrée (on se bornera à ce seul cas). 

Soit donc {ez, e2, …, eh} une base de E, et {V1, Va, …, Vn} 
une nouvelle base de E dont chacun des vecteurs s'ex- 
prime en fonction de l’ancienne : 


n n n 
Vi = si &1j €j) V2 = 2 @2j Er es Vn = 2. Anj €j 
= j=1 jÆi 


(les indices doubles nous permettent de garder la même 
lettre de référence pour les composantes tout en les diffé- 
renciant pour chaque décomposition). La matrice : 
A = (&j)i=1,.….,n 
j=1, ..,n 
est la représentation de l'application identité par rapport, 
respectivement, aux bases (i);-:,..,, et (ei):-1,.…,n (le 
lecteur peut vérifier que l’image de wi, donc v; lui-même, 
s'écrit @:1 61 + &:2 €2 + … + &in en, d'où l'expression de 
la matrice A). 
Prenons alors un vecteur X € E; dans la première base, 
n n 
ilse décompose en Ei x: e: et, dans la seconde,en > Pi Vi. 
i=1 
n 
L'expression de v; dans la première base, soit À âij Ej, 
fe 


i=l 


donne donc : 


n n n n 
X= > > aa À (S pas) as 
= 


i=1 j=1 j=iki= 
Appelons alors Xe) et Xç» les vecteurs-colonnes 
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<« Figure 9 : pour 

la projection p: 

(x, y, z) = (x, O, O) de R® 
sur l'axe OX, le plan (P) 
défini par Oy et Oz 
représente Ker (p), 

et l'axe Ox représente 

Im (p). 


<« Figure 8 bis : rang 
d'une application linéaire. 


Figure 10 :a,en 
dimension finie, 

Eet E* * sont 
isomorphes;b, en dimension 
infinie, & est seulement 
surjective. 


représentant X dans les bases (e5):-1, ..,n et (Vi)i=1, nr 
respectivement; la relation : 

Xe — À X Xçi (1) traduit le résultat ainsi obtenu; 
dans cette égalité, À est donc la matrice où le k-ième 
vecteur-colonne est formé des composantes £ dans la 
base (@):-:, nr du vecteur Vg. 

Puisque À est une matrice inversible (car l'application 
associée est bijective), on peut multiplier, à gauche, 
chaque membre de l'égalité (1) par la matrice A”, 
et on obtient AL Xçer) = Xçui (puisque AA = |). 

Soit maintenant fe Ç (E), M sa matrice relativement à 
la base (e:):-1,..,n et M° sa matrice relativement à la 
base (wi);:-1, …, PourtoutélémentxeE, soit y = f (x), 
ce qui s'écrit : 


Ye = MXçeiy et Y(oi = M'X(). 
De plus : 

Xçein = AXçwi) et Y(ei) = AY(i); 
donc Yen = MAX Gi) = AY (où 


ce qui donne encore : 
Yon = AT MAX (oi); 


donc, par comparaison, on obtient la relation fondamen- 
tale : 


mais Y (oi) = M'X(wi) 


M'=A-1.M.A 


On montrera plus loin des applications de cet impor- 
tant résultat. Ajoutons simplement que deux matrices 
carrées À et B sont dites équivalentes, si elles représentent 
le même endomorphisme mais dans deux bases diffé- 
rentes: elles sont donc telles qu'il existe une matrice Q 
inversible vérifiant B — O-1: A: O.Ils’agit là d'unerelation 
d'équivalence entre matrices carrées de même ordre. 


La dualité 


Si E est un espace vectoriel sur un corps K, l'ensemble 
des applications linéaires de E dans K, ou encore formes 
linéaires sur E, est un espace vectoriel sur K pour les deux 
lois classiques ; on l'appelle espace dual de E, et on le note 
E*. Cette idée peut se prolonger, et on peut ainsi définir 
l'ensemble des applications linéaires de E* dans K (formes 
linéaires sur E*) que l’on appelle bidual de E, noté E**. 
Des liens étroits peuvent être tracés entre les espaces E, 
E* et E**; et, malgré son apparence abstraite (tel que nous 
venons de le poser), ce problème est né sur des idées très 
concrètes de géométrie, par l'étude des transformations 
par polaires réciproques (due à Poncelet) et des formes 
quadratiques (Môbius, Chasles, etc.). 

On a vu que, si dimmE=#" et dimx F = p, alors 
dimx £ (E, F) = np. On en déduit que, si E est de dimen- 
sion finie n, alors E* est aussi de dimension finie n (toute- 
fois, si E est de dimension infinie, E* est aussi de dimension 
infinie, mais il n‘existe plus d'isomorphisme entre eux). 
L'isomorphie de E et E* va être définie par une base de E*. 
Soit (e:);-1, … une base de E. Tout élément xe E s'écrit 

n 
x = k5 xe, et cette décomposition est unique. Pour 
i=1 
chaque valeur de l'indice /, l'application ef: x > x; est 
une forme linéaire sur E. On a ainsi n éléments du dual E*, 
soit el, e2, …, e?, qui forment un système libre — ce qu'on 
montre aisément — donc une base de E*, qu'on nomme 
base duale de la base (e:);-:1, …,,. Les formes linéaires ef 
peuvent être définies, de façon concise, par : 


et (&)=0 si i£ 

et (ei) =1 
que l'on peut encore simplifier par l'usage du symbole de 
Kronecker à;; défini par : 


1 si 


[1 & fm 
| O si 


ED 


di; = 


On a alors: 
et (e;) = à 


L'isomorphisme [à la base (&:);-:,..,,, on fait corres- 
pondre la base (eï);_:,.,A1] ainsi construit n'est pas 
canonique puisqu'il dépend de la base choisie dans l'es- 
pace E. 


Formes bilinéaires 
Soit E et F deux espaces vectoriels sur le même corps 
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de base K. L'ensemble produit E X F peut être muni d'une 
structure d'espace vectoriel sur K par les 2 lois: 

(a, «) + (b,8) = (a+ b,a+ 6) 

Sia€E,. bEE,«erF,Per 
1eK,aeEet «er. 


Les axiomes de structure se vérifient aisément sur /'espace 
vectoriel produit E X F, et l'on montre que si E et F sont 
de dimensions finies, alors 
dimx (E X F) = dimx E + dimx F. 
Appelons forme bilinéaire définie sur E X F une appli- 


cation de E X F dans K qui soit linéaire par rapport à 
chacun de ses arguments. Une telle application 


f=ExF-Kk 


À (a, a) = (Xa, ka) si 


doit donc vérifier : 
f(a— kb,a) —f(a, ax) + kf (b, à) 
f(a, x + kB) = f (a, x) + kf (a, B). 


Une forme bilinéaire bien connue est celle dite produit 
scalaire : si E et F sont de même dimension finie » sur K, 
soit x € E décomposé sous la forme (x1, X2, …, Xn) rela- 
tivement à une base donnée de E, et soit y € F décomposé 
en (y1, V2 …, Yn) par rapport à une base donnée de F; 


n 
alors (x, y) —> X1 V1 + X2 V2 + … + Xn Yn = si x; yiest 
i=1 
une forme bilinéaire sur E X F, appelée produit scalaire 
de x et y. SiE— F = R? ou si E — F — R3, on retrouve 
la notion analytique du produit scalaire dans le plan ou 
dans l'espace. On définit une forme bilinéaire sur E X E* 
(dite produit scalaire sur E X E*) par: 


(XF) <x FD =f(x) si fEE* et xEeE. 


La notation x, fÿ est plus spécialement utilisée dans les 
questions relatives à l'espace dual; on dit que l'on a des 
crochets de dualité. Cette application est canonique 
puisque le résultat ne dépend pas de bases choisies entre E 
et E*. En fixant x € E, et en faisant varier f € E*, on obtient 
une forme linéaire sur E*, donc un élément — lié à x — 
du bidual E**, et que l'on notera X; K:f— €x, f). 
L'application de E dans E** ainsi mise en évidence, qui à 
tout $ € E associe xe E**, est linéaire; c’est un morphisme 
canonique de E dans E** qui va permettre de dégager les 
liens de dualité. 

Tout d’abord, dans le cas où l'espace E est de dimension 
finie n, on a encore 

dimx E** = dimx (E*)* = dimg E* = dimg E = n. 
De plus supposons que l'on ait deux éléments K et ÿ 
égaux, alors <Xx,f> = <ÿ,f> pour tout fEE*, donc 
x — ÿ, f> = 0, en prenant successivement pour f les 
formes el, e2, …, e?, on obtient : 


X1— Yi 0, x2—ÿy2= 0, … 
donc x = y. 


Xn — Yn = 0 


Par conséquent, le morphisme x — est injectif, donc 
bijectif, ce qui entraîne : si E est de dimension finie, les 
espaces E et E** sont canoniquement isomorphes. 

Il est donc possible d'identifier E et E** (à un isomor- 
phisme près), et par conséquent de considérer E comme le 
dual de E*. La dualité est ainsi un phénomène « symétri- 
que » présentant une réciprocité : E et E* sont duaux 
l'un de l’autre. Cette propriété permet de conclure que 
chaque élément de E peut être considéré comme une 
forme linéaire sur E* (en identifiant x et X définis dans 
l'isomorphisme canonique). 

Dans le cas où l'espace vectoriel E est de dimension 
infinie, il faut noter que l’homomorphisme canonique 
x = & est injectif, mais non surjectif. L'isomorphisme, mis 
en évidence si dim E < + @ (fig. 10), n'en est 
plus un en dimension infinie. 
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Transposition. 

Soit E et F deux espaces vectoriels sur le corps K, et 
fe£ (E,F).Pourtoutge£ (F*,E*)ettoutxeF*,g (x)EE*, 
donc g («):E—K; d'autre part f:E—=Feta:F—K 
impliquent que «of : E—K. On peut alors montrer 
qu'il existe une application g € £ (F*, E*) et une seule 
telle que : g (x) — «of. Cette application se nomme trans- 
posée de 7, ce qui s'écrit #/, et est donc définie par : 


(1) CF (a),x = af (D 


pourtout x € Eetpourtoutxe F*. 


La représentation matricielle de test très simple à déter- 
miner. Si E est de dimension n et F de dimension p, soit 
(ej);=1, … n une base de E et (f);-1,..., , une base de F; 
on désigne par (ei);-1 .,n et (f);-1,,, les bases 
duales. Alors si A — (a;;);-1 ….,, estla matrice de frela- 

SE PÉPOE EL 
tivement aux bases choisies de E et F, l'égalité (1) permet 
de montrer que la matrice B de ff relativement aux bases 
duales est définie par b;;j — ai. 

Cela revient à dire que B est une matrice (n, p) obtenue 
à partir de À en inversant (en transposant, ce qui explique 
le nom choisi pour tf) le rôle des lignes et des colonnes. 

Les principales règles de calcul en transposition sont : 


— tf+g)=#f+tg t(K)=k(r) Ugor) = foig 
— Si f admet une réciproque, il en est de même pour 
tf et (#f)-l—t(f) 


Et de même que E et E** sont isomorphes si E est de 
dimension finie, on a (pour des espaces E et F de dimen- 
sions finies) un isomorphisme entre € (E, F) et £ (F*, E*) 
qui n'est autre que l'application f + tf. Dans ce cas, 
on a donc: t (tf) = f. 


Orthogonalité 

Soit E et F deux espaces vectoriels sur un même corps 
Ketg:E x F— K une forme bilinéaire sur E x F. On 
ditquexeEetæeF sont orthogonaux relativement à g 
sig (x, x) = 0. Dans le cas où F — E*, ceci revient à dire 
que x, «ÿ = «x (x) = 0, et on dit simplement que x et 
x sont orthogonaux. 

Une partie À de E et une partie B de F sont orthogo- 
nales relativement à g si l'on a g (x, «) — O pour tout 
élément de x€E, ettout « e F. Dans le cas où A est un 
sous-espace vectoriel de E, l'ensemble des éléments de F 
orthogonaux à tous les éléments de À est un sous- 
espace vectoriel de F, dit orthogonal de À dans F, rela- 
tivement à g, noté At. De même pour l'orthogonal d'un 
sous-espace vectoriel B de F, qui se note Bt; lorsque 
F = E*, on ne précise plus la forme g. Cette notion n'est 
que la généralisation algébrique de la notion classique 
— en géométrie — d'orthogonalité. 

Lorsque l'espace vectoriel E est de dimension finie A, 
si le sous-espace À & E est de dimension p, l'ortho- 
gonal At est de dimension n — p; dans ce cas (dimension 
finie), on a encore « symétrie » entre F (dans E) et FL 
(dans E*) puisque (F1)1—F, car alors (F+)1 est un 
sous-espace vectoriel de E** donc de E, de dimension 
n— (n—p) = p. 

Les notions de transposition et d'orthogonalité (en 
dimension finie) sont liées par le résultat : 


sifef£ (EF), alors (Imf)i = Ker (ff). 


Dans le cas d'espaces de dimensions finies, le lien est 
alors plus précis encore entre une application et sa trans- 
posée, car alors rg f — rg (‘f) que l'on montre à l’aide du 
résultat précédent, et qui donne beaucoup de développe- 
ments dans les techniques d'optimisation et les méthodes 
de résolution des systèmes d'équations linéaires. 

Il est certain que la dualité s'est révélée comme une des 
notions les plus fécondes en mathématiques. 


Systèmes d'équations linéaires 


Soit E et F deux espaces vectoriels sur le même corps 
K. On appelle équation linéaire une équation de la forme 
f(x) =boùfel (E,F)ethbeF. Lorsque F = K, alors feE*: 
on a une équation linéaire scalaire. De même, un ensemble 
fini d'équations #; (x) = b; où EL (E, F) et beF 
s'appelle un système linéaire (scalaire lorsque F = K). 
Résoudre ces équations consiste à trouver les éléments 
xEeE qui les vérifient. Ce type d'équations se trouve dans 
tous les domaines, et la mise au point des techniques de 
recherche des solutions, œuvre de Frôbenius (1849-1917), 


Kronecker (1823-1891), Weierstrass (1815-1897), etc., 
a été l’une des grandes étapes du développement des 
mathématiques. Le formalisme des espaces vectoriels 
donne une méthode pratique de résolution, quels que 
soient l'espace E, l'espace F et le nombre d'équations du 
système, grâce au puissant outil qu'est le calcul matriciel. 

Dans ce qui suit, on suppose que E est un espace vecto- 
riel réel de dimension finie p, muni d'une base (e;),_;, 
et F un espace vectoriel réel de dimension finie n, 
(f):-1, …, n en étant une base; on se donne FE (E,F) 
et bEF, et on cherche l'ensemble des x€E tels que 
f(x) = b. 

On peut écrire : 


p p 
x = > x ex doncf(x) = > x f (e;). 
j=1 = 1 


Puisque (#);-1,.., , est une base de Fetquef (e&)€F,on 
peut aussi écrire : 


n 
f (e;) = > &ij fi. 
i=1 
Et l'égalité — composante par composante — entre 
b et f (x) donne : 


n 
b; = bi aÿ X pouri= 1,2,.…,n. 
j=1 


Soit donc n équations scalaires à p inconnues. La matrice 

A = (aj):-1,.,n est la matrice de f relativement aux 
i=1,..,? 

deux bases choisies, et si l'on pose X, représentation de x 
dans la base (e;);,_: ,, et B représentation de b dans 
la base (f);-:1, ., sous forme de vecteur-colonne, on 
obtient la forme matricielle AX = B. 

Quelques remarques simples permettent de cerner 
le problème : 


— sibé£élmf, il ny a aucune solution; 

— sibelmf,il y a au moins une solution. 
*X Sib = O0, les solutions forment l'ensemble 
Ker f, et il y a toujours au moins la solution dite 
triviale x = 0 ; le système est dit homogène. 
* Sib £ Oetsize Kerf, pour toute solution x, 
x + z est aussi solution, car 

F(x+z)=Ff(x) +f(z) = f(x) = b. 


Les deux ensembles Im f et Ker f déterminent totale- 
ment les solutions. Le cas particulier où n = p se discute 
comme suit. 

(1) Si l'application f est bijective, la matrice A 
possède une inverse Al et, de l'équation AX = B, on 
déduit A1 AX — A-1B, soit X = A-1B. 

La solution est unique, ce qui était prévisible puisque 
f est bijective. 

En particulier, si b = 0, on retrouve le fait que 
Ker f = {0}. On retrouve un système dit de Cramer, du 
nom du mathématicien suisse Cramer (1704-1752), où 
le système homogène associé n’admet que la solution 
triviale x — 0, et qui admet alors une solution unique. 
Résoudre un système de Cramer revient à trouver l'in- 
verse de la matrice du système; les procédés pratiques 
d'inversion de matrices sont exposés au paragraphe 4/go- 
rithme de Gauss ou du pivot du chap. calcul numérique. 

(2) Lorsque l'application f n'est pas bijective, il 
n'est plus nécessaire de supposer à priori que n = p, 
car on ne cherche pas à inverser la matrice A. 

L'idée directrice est alors de se ramener, en « élimi- 
nant » si besoin est des inconnues et des équations, 
à un système de Cramer (la notion claire de rang d'un 
système est due au mathématicien allemand G. F. Frô- 
benius). On cherche pour cela si certaines équations ne 
sont pas redondantes, c'est-à-dire s'il n'y a pas d'équa- 
tions linéairement dépendantes (par exemple : 


2x+y—3z+1—-0, x+2y—2z+2t—=1 


et x—y—z—t— 1 sont redondantes, car la première 
est égale à la somme des deux autres). Autrement dit, 
on calcule alors le rang r de la matrice À, ce qui permet 
d'affirmer que l’on a réellement r équations (r < p 
etr < n).Surles p inconnues, il faudra donc en supposer 
p — r arbitraires et résoudre le système en fonction de 
celles-ci. Les r inconnues qui sont alors déterminées sont 
dites inconnues principales, et les (p—r) autres non 
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> À gauche, figure 11 : 
développement d'un 
déterminant d'ordre 3 

par la règle de Sarrus. 

A droite, figure 12: 

deux exemples d'affectation 
de signes pour le calcul 
d'un déterminant : 

a, d'ordre impair ; 

b, d'ordre pair. 


principales. Dans chaque équation, on fait passer dans le 
second membre tout ce qui est relatif aux équations non 
principales, et on obtient alors un système de Cramer der 
équations à 7 inconnues que l'on sait résoudre. 

Voici un exemple : 


2x—y+4z+t= 4 
3x+2y—3z—b5it—= 17 
Dx—3y—-8z—2i— 10 


C'est un système de rang 3: il y aura une inconnue non 


principale, par exemple #, et donc indétermination 

d'ordre 1. 

On écrit alors le système : 
2x—y+4z a—t 
3x+2y—3z—17+5t 
5x—3y+—8z——10—21t. 


que l’on résout par la méthode du pivot. 

La théorie des systèmes linéaires est un outil fonda- 
mental pour les méthodes modernes de l'économie sans 
oublier les applications diverses dans toute science 
exacte. 


Déterminants 


Une forme linéaire sur un espace vectoriel E (de corps 
de base K) est une application de E dans K vérifiant 
l'hypothèse de linéarité. Cette notion s'étend à celle de 
forme n-linéaire, qui est une application de l'espace 
vectoriel produit E% — E x E x … x E (n fois), dans K, 
linéaire par rapport à chacun des arguments (si 7 = 2, 
on retrouve la notion de forme bilinéaire). Il faut ici bien 
distinguer la linéarité par rapport à chaque variable 
de la linéarité simple par rapport aux éléments de E?. 
Dans le premier cas, on a: 

F (XX) = F EX (xx, X2, …, Xn)] = F (x, ÀXe, …, AXn) 
XF (X1, Axe, …, ÀXn) 
= )2f (x1, Xe, …, AXn) = A (X) ; 


tandis que dans le second : f (AX) — àf (X), ce qui 
revient à dire que l’on a ici une forme linéaire sur E. 

On dit qu'une forme n-linéaire sur E, f, est alternée si elle 
s'’annule dès que deux des arguments sont égaux; ceci 
équivaut au fait que la valeur de fse change en son opposé 
si l'on permute deux arguments : 


FOX rnb se Mrs KR) 


= — f (xx, XXe 27 Xe vor Xi) 


L'ensemble des formes n-linéaires alternées sur E forme 
bien évidemment un espace vectoriel sur K pour les opé- 
rations usuelles : 


QG f) =. 


Le résultat suivant est en fait la clef de ce paragraphe. 
Si £x1, x2, …, xn} forme un système lié, alors 


(£g) ST g (et 


F (X1, X2, …, Xn) = 0 si f est une forme n-linéaire alternée 
sur E. 

Si f est une forme n-linéaire alternée sur E et si 
F (Xi, X2, .…, Xn) — ©, alors {x1, X2, …, Xn} est un système 
lié dans E. 


Richard Colin 


70 


Il définit l'idée d’une grandeur caractérisant la dépen- 
dance ou l'indépendance d'un système de vecteurs. La 
définition axiomatique des déterminants a été donnée 
par Kronecker et Weierstrass, bien que l'outil ait été 
connu et utilisé depuis le début du XIX® siècle, essentiel- 
lement rattaché au calcul vectoriel, très exactement au 
produit extérieur (ou produit vectoriel) et au produit mixte, 
pour les éléments de l'espace à 3 dimensions. 


Définition 

On appelle déterminant relatif à la base (e;);-:1,..., x 
du système {x1, x2, …, xn} de vecteurs de E, la valeur de 
la forme n-linéaire alternée unique qui prend la valeur 
+ 1 pour les vecteurs de la base. 

Chaque vecteur se décomposant dans la base donnée : 


i=n 
Xk = > aix ei, le déterminant du système {x1, X2, …, Xn} 
F1 


est écrit : 
O1 .… ii Yin 
os CZ : ; 
Ge 22 | avec des barres droites simples 
. se S (afin de ne pas confondre avec 
4 … Er | l'écriture matricielle). 
An1 Xni Ann 


On peut considérer qu'une matrice carrée d'ordre n 
est formée de ses n vecteurs-colonnes, vecteurs à n com- 
posantes. On parlera donc, par abréviation, du détermi- 
nant d'une matrice au lieu du déterminant du système des 
vecteurs-colonnes de cette matrice. 


Calcul des déterminants d'ordre 1, 2 et 3 

En partant du cas le plus simple, on a [au] = œ1 
(ne pas confondre ici les barres du déterminant avec le 
symbole d'une valeur absolue sur R ou d'un module 
sur C) ; puis à l’ordre 2: 


11 %12 
d21 %22 


— 411422 — W12%21 


(produit des « extrêmes » diminué du produit des 
« moyens »). 
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Enfin, à l'ordre 3, on a la règle dite règle de Sarrus : 
on reprend sous le déterminant les 2 premières lignes pour 
pouvoir tracer (fig. 11) les trois « diagonales principales » 
partant des éléments de la première colonne, et les trois 
« diagonales non principales » partant des éléments de la 
dernière colonne. Sur chaque « diagonale », on fait le 
produit des trois éléments; on affecte les résultats du 
signe + pour les diagonales principales, et du signe — 
pour les autres, et l’on obtient le nombre : 


W11422033 + 4120423481 + 4183421482) — 
(t312%22013 + A320230411 + 4332421212) 


(on peut constater que c'est la généralisation du calcul 
à l'ordre 2). 


Méthode générale de calcul 

Au-delà de l'ordre 3, l'idée du calcul est de procéder 
par récurrence: la méthode est dite : « développement 
par rapport à une ligne ou une colonne ». 

A tout élément x; du déterminant, on associe : 

(1) un signe, + ou — selon sa position, égal à 
celui de (—1){+7; il découle donc de ceci que deux 
éléments voisins en ligne ou en colonne, mais pas en 
diagonale, se voient affectés de signes opposés; 

(2) un déterminant d'ordre n — 1, appelé mineur 
de «;, obtenu en supprimant dans le déterminant initial 
la ligne et la colonne sur lesquelles se trouve &;; 

(3) son cofacteur, égal au produit des deux pré- 
cédents. La fig. 12 montre deux exemples d'affectation 
de signe pour n pair, puis n impair, et la fig. 13 schématise 
le mineur d'un élément. 

La valeur d'un déterminant est alors obtenue en choi- 
sissant une ligne ou une colonne quelconque, en faisant 
le produit de chaque élément de celle-ci par son cofacteur, 
et en sommant sur toute la ligne ou la colonne considérée. 
Le résultat est indifférent au choix de la ligne ou de la 
colonne. Le calcul d'un déterminant d'ordre n revient alors 
à celui de n déterminants d'ordre (n — 1), soit n (n—1) 
déterminants d'ordre (n — 2), et donc à celui de 


n(n—1) (n—2). x 8 in 


déterminants d'ordre 2 que l'on sait aisément calculer. 
Le procédé est en général fastidieux dès que la valeur 
de n dépasse 6 ou 7. 

Dans cette méthode, il faut choisir la ligne ou la colonne 
présentant le plus d'éléments nuls. En particulier, le déter- 
minant d’une matrice triangulaire (a fortiori si elle est dia- 
gonale) est égal au produit des éléments de la diagonale. 

Un certain nombre de propriétés permettent même de 
modifier l'écriture d'un déterminant sans en changer la 
valeur. Utilisées pour obtenir un grand nombre de zéros, 
ces propriétés sont la transcription de celles des formes 
n-linéaires alternées. 

Propriété 1 : det À = det ‘A. 

Propriété 2 : permuter deux lignes — ou deux colon- 
nes — revient à changer la valeur du déterminant en son 
opposée. 

Propriété 3 : multiplier tous les éléments d'une même 
ligne — ou d'une même colonne — d'un déterminant par 
un nombre équivaut à multiplier la valeur du déterminant 
par ce nombre. Ce qui entraîne que det (KA) — k” det A, 
si n est l'ordre de A et ke K un scalaire. 

Propriété 4 : ajouter à une ligne (resp. colonne) 
une combinaison linéaire des autres lignes (resp. colonnes) 
ne change pas la valeur d'un déterminant. 

Les opérations entre déterminants se définissent alors 
simplement. 

(1) La somme de deux déterminants D et D’, 
ne différant que par une ligne (resp. colonne) de même 
position 4, est un déterminant identique, mais dont la 
k-ième ligne (resp. colonne) est égale à la somme des 
k-ièmes lignes (resp. colonnes) de D et D’. 

(2) Le produit de deux déterminants est le déter- 
minant de la matrice produit. 

De cette règle, on déduit une interprétation globale des 
déterminants. En effet, puisque 


det (AB) = (det À) x (det B), 


on a : det (AB) = det (BA). Or deux matrices semblables 
M et N sont liées par une relation M = P-1: N-P, 
donc : det M = det (P-1. N.P) = det (P-1N): det P — 
det P-1. det N . det P = det P-1. det P - det N, soit det M — 
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det (P-1 P) : det N — det N puisque P-1 P = |, et que 
det In = + 1. 

Il est donc plus clair, maintenant, de parler du détermi- 
nant d'un endomorphisme, et l'on peut énoncer comme 
suit. 

Théorème. Soit f e © (E); f est inversible si et seu- 
lement si la matrice de 7, relativement à une base quel- 
conque de E, a un déterminant non nul. 

Applications. Les utilisations des déterminants 
sont nombreuses. Toutefois l'outil n'est pas toujours 
simple à manier. Ceci explique que les méthodes de cal- 
cul numérique utilisées dans les programmes de calcul 
scientifique soient basées sur des algorithmes plus 
proches des concepts linéaires. Toutefois deux applica- 
tions pratiques méritent d'être mentionnées : 

— la recherche du rang d'une matrice; 
— l'orientation dans un espace vectoriel réel de 
dimension finie. 

@e Le théorème ci-dessous décrit totalement la pre- 
mière de ces questions. 

Théorème. Si E et F sont deux espaces vectoriels 
de dimensions finies (non nécessairement égales) sur 
le corps K, sife£ (E, F) et si À est la matrice de f rela- 
tivement à deux bases choisies de E et F, alors le rang de 
cette application vérifie : 


rg f = dimf(E) = dimimf= 7g A = rgtf=rg'tA 


et ce nombre est encore le nombre maximal de vecteurs- 
colonnes — ou de vecteurs-lignes — linéairement indé- 
pendants que l’on peut extraire de À, soit aussi la dimen- 
sion du plus grand mineur non nul qu'il est possible de 
trouver dans A. 

@e Dans le second problème, il s’agit d'une applica- 
tion très utile en physique, et qui consiste à distinguer 
deux classes de bases pour un espace vectoriel réel E, 
de dimension finie p, par l'intermédiaire d'une relation 
d'équivalence. Si (@i);-1,..,n €t (f);=1, …,» Sont deux 
bases de E, on dira qu'elles sont équivalentes si le déter- 
minant du système formé par l'une d'elles, par rapport à 
l’autre base, est positif ; il s’agit bien d'une relation d'équi- 
valence. Alors, pour une base B donnée, l'ensemble de 
toutes les bases de E peut être scindé en deux classes : 

— les bases équivalentes à B, dites bases directes 
ou orientées positives ; 

— les autres bases, dites rétrogrades ou orientées 
négatives. 

Mais les déterminants sont en réalité un outil d'algèbre 
multilinéaire dont les utilisations, fastidieuses dans le 
cas linéaire, peuvent souvent être évitées. 


Les invariants 


C'est encore une question de géométrie (la classifi- 
cation des courbes du second degré) qui est à l'origine du 
problème de la réduction des matrices, c'est-à-dire la 
recherche d’une base dans laquelle la matrice d'un endo- 
morphisme prend une forme simple : diagonale, triangulaire 
ou encore forme de Jordan. Les études de A. Cayley, 
C. Hermite et J. J. Sylvester se sont révélées d'une rare 
fécondité par leur aspect unificateur des problèmes exis- 
tants et leurs multiples applications; la théorie des repré- 
sentations du groupe linéaire est en fait née de leurs 
travaux. C'est également la « théorie spectrale », et donc 
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xAA, A2 A4 
x31 32 K34 


x41 %XA2 44 


A Figure 13 : caractérisation 
du mineur d'un élément. 


le lien concret entre l'algèbre linéaire, l'analyse et l'algèbre 
tensorielle, qui est issue de leurs recherches. 

Le premier problème est de déterminer s'il existe 
— et dans ce cas, de caractériser — des sous-espaces 
vectoriels de dimensions les plus petites possibles (le 
meilleur cas sera la dimension 1) qui soient invariants 
pour un endomorphisme f d'un espace vectoriel E de 
dimension finie p. Lorsqu'un tel sous-espace F est de 
dimension 1, il est engendré par un seul vecteur, non nul, 
dont l'image doit donc être dans F et par suite être un 
multiple de V. On est donc conduit à poser la définition 
suivante : un vecteur VE E, non nul, est dit vecteur propre 
pourfe£ (E) s'il existe un scalaire & tel que f (V) = KV (1). 

On dit que K est une valeur propre de f s'il existe un 
vecteur VEE, non nul, vérifiant (1). 

A un vecteur propre V ne correspond qu'une seule 
valeur propre K, dite valeur propre associée à V; tandis 
qu'à une valeur propre k correspond une infinité de vec- 
teurs propres 
[car, si f (V) = kV, alors f (aV) — af (V) = akV = k (aV)] 
dont l'ensemble, complété par le vecteur nul, forme un 
sous-espace vectoriel, que l'on appelle sous-espace 
propre associé à k. C'est un des sous-espaces invariants 
recherchés ; il est distinct de {0}, et sa dimension est donc 
au moins égale à 1. L'étude des dimensions des sous- 
espaces propres donne les résultats fondamentaux de la 
réduction des matrices. 

Dans un espace du type RP, le but est d'abord la recher- 
che des droites stables par f, c'est-à-dire dont les vec- 
teurs aient des images homothétiques. Dans R3 par 
exemple, on cherche à « voir» si une transformation linéaire 
ne peut pas être ramenée à des dilatations le long de 
trois axes de coordonnées. La résolution analytique du 
problème tend souvent à faire oublier son aspect tant 
géométrique que linéaire. C'est pourquoi, à l'exception 
d'ure méthode de calcul, on posera le plus souvent la 
question des sous-espaces propres, et non celle des 
valeurs propres. 


Calcul des valeurs propres 

Si & est valeur propre associée au vecteur propre V, 
on a : f (V) = kV, soit f (V) — kV = 0. Or f (V) — KV 
est l’image du vecteur V par l'application linéaire f — k : Id, 
donc VE Ker (f— k:1d). Comme V est non nul, ce 
sous-espace doit être distinct de {0}, et donc l'application 
f— k: Id ne doit pas être bijective et ne possède alors 
pas de réciproque. Par conséquent, si on se donne une 
base de E, et si par rapport à cette base A est la matrice 
de f, et | celle de l'application identité (cas de la dimension 
finie), les valeurs propres de f seront les solutions de 
l'équation : 

det (A — kl) = O. 


Si E est de dimension p, alors À est d'ordre p et 
det (A — ki) est un polynôme de degré p en k qu'on 
appelle polynôme caractéristique de l'endomorphisme f, 
ou de la matrice A. 

Pour une valeur propre donnée k, l'équation matricielle 
(A — kl) V = O où V est un vecteur à p coordonnées 
permet de déterminer les sous-espaces propres. Puisque 
ce système homogène de p équations à p inconnues a une 
matrice non inversible, son rang r est strictement plus 
petit que p; la différence entre p et r est la dimension du 
sous-espace propre. C'est en effet ce nombre qui carac- 
térise le nombre d'inconnues non principales du système, 
donc son degré d'indétermination. On peut le voir encore 
d'une autre façon : p = dim Im (f— 1) + dim Ker (f— kl) 
donc dim Ker (f— k1) = p —7. 

Les propriétés algébriques des sous-espaces propres 
se résument dans le théorème qui suit. 

Théorème. Si k1 et k2 sont deux valeurs propres 
distinctes d'une application FE £ (E), et si G (ki) et 
G (k2) sont les sous-espaces propres associés, on a : 


G (ki) N G (k2) = {0}. 


De plus si k1, k2, …, kn Sont toutes les valeurs propres 
distinctes de 7, et si V1, V2, …, V, sont des vecteurs propres 
qui leur sont respectivement associés, la famille de vec- 
teurs {V1, Vo, …, VA} est libre. 

Comme les systèmes libres de E ont au plus p éléments 
lorsque dimx Ë = p, il y a au plus p valeurs propres dis- 
tinctes. Pour chercher s'il existe un certain nombre de 
sous-espaces de E, invariants par 7, et dont la somme 
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directe soit E, il faut et il suffit de chercher une base de E 
formée de vecteurs propres. Dans ce cas, l’endomor- 
phisme f opère indépendamment dans chaque direction 
de l'espace à p dimensions, et chaque fois comme une 
homothétie. 

La matrice A de f, relativement à cette base de vecteurs 
propres, prend une forme diagonale, car, pour tout 
vecteur V; (= 1,2, p) de la base, on a f (V;) = kiV:; 
et le /-ième vecteur-colonne de A ne possède qu'une 
coordonnée non nulle, la -ième, qui est égale à k;, et A 
prend bien la forme ci-dessous. 


Kt:0 0.3, 0 
O ka O … © 
00k. 0 
à à 8. 


On parle dans ce cas de matrice (ou d'endomorphisme) 
diagonalisable. Une condition nécessaire et suffisante 
pour qu'il en soit ainsi est donnée par le théorème qui suit. 

Théorème. Soit E de dimension finie sur le corps K. 
L'application fe Ê (E) est diagonalisable si et seulement 
si toutes les racines du polynôme caractéristique sont 
dans K, et si, pour toute valeur propre, la dimension du 
sous-espace propre associé est égale à l'ordre de multi- 
plicité de cette valeur propre dans le polynôme caracté- 
ristique. 

En particulier, si f possède p valeurs propres distinctes 
toutes dans K, chacune ne peut être que racine simple 
du polynôme caractéristique. Cette condition n'est que 
suffisante ; elle n’est pas nécessaire. 

Il n'est pas toujours possible de diagonaliser une 
matrice. La réduction à la forme triangulaire, moins inté- 
ressante, mais plus fréquemment possible, consiste à 
trouver une base de E telle que la matrice exprimée dans 
cette base soit triangulaire (inférieure ou supérieure). Ceci 
est réalisable dès que toutes les racines du polynôme 
caractéristique de f sont des éléments de K:; par exemple, 
siK = corps algébriquement clos (cf. les Nombres), tout 
endomorphisme de E est «triangulaire ». La diagonale de la 
matrice triangulaire est alors formée par les valeurs 
propres. 

La forme réduite de Jordan, forme de matrice 
triangulaire supérieure À — (à;;);-1, … , telle que, parmi 


les éléments au-dessus de la diagonale, seuls les éléments 
ä&i,i +1 puissent être non nuls (et dans ce cas égaux à 1) 
— les éléments diagonaux étant les valeurs propres, cha- 
cune comptée avec son ordre de multiplicité — peut être 
obtenue dès que l'endomorphisme est nilpotent (c'est-à- 
dire si une puissance de f est nulle, donc aussi les sui- 
vantes). L'exemple ci-dessous montre une forme réduite 
de Jordan (les éléments diagonaux ne sont pas nécessai- 
rement distincts). 


Kit QG: © © 
O k2 0 …. O0 O0 
0 0 k:. 0 . © 
O: O0 © … 1 0 
G O0: À … Kx=4 1 
0 0 0 …. O kx 


Un très célèbre résultat — le théorème de Cayley-Hamil- 
ton — est à l'origine de nombreux développements. Sous 
une forme particulièrement simple, il montre que sife£ (E) 


admet P (x) = 40 + aix + + a,x? pour polynôme 
caractéristique (dimx E — p), alors l'endomorphisme 
aold + a1f + … — a,fP (où FF = fofo…of,kfois) est 


identiquement nul (tout élément de E a pour image le vec- 
teur nul). Si À est la matrice de f relativement à une base 
quelconque, on a donc : a1l + a1A + … + a,AP = 0. 

On dit que le polynôme caractéristique est un poly- 
nôme annulateur de A ou def. 

La théorie des polynômes sur un anneau permet alors 
de dire (en dimension finie) que l’ensemble des poly- 
nômes annulateurs d'une matrice À (qui n’est pas vide 
puisqu'il contient le polynôme caractéristique) possède 
un élément de plus petit degré tel que tout autre élément 
en soit multiple : c'est le polynôme minimal de À (ou def) 
dont le degré est au plus égal à p. Les racines de ce poly- 
nôme sont les mêmes que celles du polynôme caracté- 
ristique les valeurs propres. Elles sont invariantes 


— comme les polynômes d'ailleurs — par changement de 
base : leur ensemble est appelé spectre de f, noté Sp (f). 

La notion de fonction de matrice, jusque-là limitée 
aux fonctions polynômiales, a pu alors être généralisée, 
et des expressions telles que le logarithme d'une matrice, 
une exponentielle de matrice, un sinus de matrices, etc. 
(dont l'usage s'avère primordial dans la résolution des 
systèmes d'équations différentiels), peuvent être consi- 
dérées et calculées sans même avoir à utiliser de séries 
dans un espace vectoriel normé (en sortant donc du 
cadre linéaire sans nécessité expresse). La détermination 
du spectre d'une matrice apparaît donc comme fonda- 
mentale pour la connaissance d'un opérateur linéaire sur 
un espace vectoriel de dimension finie. Il suffit même 
souvent pour traiter certaines questions de localiser la 
plus grande des valeurs propres (par exemple, comparer 
son module à l'unité). Le théorème de Perron-Frobenius 
est une intéressante méthode de localisation; on peut 
en donner deux versions selon que la matrice est irré- 
ductible ou non. 

On dit qu'une matrice carrée est /rréductible si une 
même permutation effectuée sur les vecteurs-colonnes 
et sur les vecteurs-lignes permet de partitionner la matrice 
obtenue en une matrice de la forme : 


M  O M  P 

| ou bien ( 

P Q. O0 à 
où M et Q sont deux sous-matrices carrées et O un bloc 
de zéros. Dans le cas contraire, la matrice est réductible. 
La figure 14a schématise la reconnaissance d'une matrice 
réductible tandis que la figure 14b fait apparaître un bloc 
de zéros diagonal qu'aucun échange simultané de lignes 
et colonnes ne peut placer dans l'une des positions en haut 
à droite ou en bas à gauche : la matrice est irréductible. 
Il s'agit en fait de procéder à une permutation sur les 
vecteurs de la base choisie, c'est-à-dire dans le cas de 
la figure 14a, parexemple, de passer de la base (1,62, 3, €4) 
à la base (e1, es, 4, e2). C'est un changement de base par- 
ticulier caractérisé par une matrice de permutation qui 
n'est autre que la matrice identité où l'on a permuté les 
vecteurs-colonnes correspondant à ceux des vecteurs 
de base échangés; ainsi, dans le cas examiné, c'est la 

matrice : 


1000 

0010 

O1 ‘010 

0001 
et l'on vérifie par le calcul que: 
2200 1000 2 0 2 0 4 0 0 © 
2 2 0 O0\ = [0 O 1 © 9: 1 812 0010 
Sue 1 2 0100 2. 0 2: 0 0 ‘1: 0 © 
1 1 22 0001 4,2; 1 2 0001 


comme pour n'importe quel changement de base. L'uti- 
lisation de ces matrices est très courante dans l'étude des 
tableaux de données économiques pour étudier les inter- 
actions dans les systèmes d'échanges. 


Théorème de Perron-Frobenius (cas irréductible) 

Soit À une matrice carrée, à éléments positifs où nuls, 
irréductible. Alors, il existe une valeur propre & > 0, plus 
grande que toute autre en valeur absolue, qui est simple 
(ordre de multiplicité égal à 1) et à laquelle correspond un 
vecteur propre dont toutes les composantes sont stric- 
tement positives; cette valeur propre est donnée par la 
formule : 

k = max bi Êr:) 
70 HE Te 
v#0 d LL 
(l'indice / désigne la /-ième coordonnée du vecteur et 
v > Osignifie qu'aucune composante de v n'est négative). 

Dans le cas où A est réductible, la valeur propre de plus 
grand module peut éventuellement être nulle (dans ce 
cas, 0 est la seule valeur propre), multiple, et les vecteurs 
propres qui lui correspondent ont des coordonnées posi- 
tives ou nulles. 

Grâce à ce théorème, on a pu construire un algorithme 
qui permet de trouver, sans trop de calculs, une bonne 
valeur approchée de 4 même si l'ordre de la matrice A 
est grand. 

Les matrices à éléments positifs dont on vient de parler 


se rencontrent fréquemment : ainsi en probabilité où l'on 
utilise les matrices stochastiques qui sont telles que la 
somme des éléments (non négatifs) d'une même ligne 
soit égale à 1. 

La plus grande valeur propre est alors k = 1 et le 
vecteur (1,1,1,..., 1) est un vecteur propre associé. Cette 
propriété est équivalente à la définition. 


Formes quadratiques 

Si f:E X E = K est une forme bilinéaire sur E, on dit 
que Q (x) — f(x, x) est la forme quadratique associée à f. 
La dénomination est claire puisque 


Q (ax) = f (ax, ax) — a?f (x, x) = a?Q (x). 


On dit que Q est positive si Q (x, x) > O pour tout 
x€eE; elle est définie positive si de plus Q (x, x) = 0 
n'a lieu que pour x — 0. A toute forme bilinéaire 7, sur E, 
on associe la matrice M = (mi):-1,», …., » relativement à 

fm 1,2; 3, D 
une base (e&);-:,.…, par : Mi = f (ei, e;). On définit 
ainsi un isomorphisme, mais non canonique, entre l'en- 
semble des formes bilinéaires sur E et l'ensemble AC; (K) 
des matrices carrées d'ordre p. 

Si X est le vecteur-colonne représentant x et YŸ celui 
représentant y dans la base (e;);_1, .,,, On a alors: 


f(x y)=#Y.iM.X=iX.iM.Y 
Lorsque f est symétrique, soit f (x, y) = f (y, x),on a: 
Q(x+y)=0Q(x) +0(y)+2F(xy); 


donc à toute forme quadratique Q on peut associer une 
forme bilinéaire symétrique 7, dite forme polaire de Q par: 


FUN = 310 + y) — 0 @ —Q (I 


L'application f — Q est donc une bijection de l'ensemble 
des formes bilinéaires symétriques dans l'ensemble des 
formes quadratiques sur E. On peut donc écrire : 


Q(x)=X-.M:X 


puisque, si M est la matrice de f, on peut dire que M est la 
matrice de O; cette matrice est symétrique, car : 


mi; = f (ei, e;) = f (e;, e;) = mj, donc M = M. 


Le problème de la réduction des matrices symétriques 
à la forme diagonale est donc le même que celui de la 
transformation — par changement de base — d'une forme 
quadratique en une somme algébrique de carrées. La 
représentation globale des courbes du second degré a 
trouvé là son terme après les énumérations fastidieuses 
longtemps enseignées. Une étude simple de la question 
à l'aide de la notion de dualité conduit aux deux résultats 
suivants. 
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A Figure 14 — a, matrice 
réductible : une permutation 
des lignes et des 

colonnes permet 

d'isoler un'bloc carré 

de zéros, non situé 

sur la diagonale; b, matrice 
irréductible : /e bloc 

de zéros ne peut être 

que diagonal. 


Richard Colin 


> Tableau I : propriétés 
de l'adjoint 
d'un endomorphisme. 


Loi d'inertie de Sylvester 

Soit f une forme bilinéaire symétrique réelle sur un 
espace vectoriel réel E de dimension p, et Q la forme qua- 
dratique associée. Alors, il existe une base (w:);_-:, telle 
quef (Vi, V5) = Gi; (symbole de Kronecker) — base ortho- 
normale relativement à f — et un couple unique 
(m, n) EN x N tels que, dans cette base, on ait : 


i=m j=m+n 
Q(m= > x— D x? avecm+n=rg (f). 
EX | j=m+i 


Théorème. Pour toute matrice symétrique réelle M 
d'ordre p, il existe une matrice T réelle d'ordre p telle que 
T-1= {T (on dit que T est orthogonale) et que la matrice 
T-1: M:T soit diagonale. 

Ainsi la forme bilinéaire symétrique définie sur R3 : 


F (XV) = X1Y1 + X2Y2 + X3Ys 
— 2 (x2Y3 + X3Y2 + X3Y1 + X1Y3 + X1Y2 + X2Y1) 


est représentée relativement à la base canonique par la 
matrice 


1—2—2 
(-2 1 —2), symétrique. 
—2—2 1 


La forme quadratique associée : 
Q (x) = x? + x5 + x3— 4 (xoX3 + Xax1 + X1X2) 
peut se réduire à la forme : 
Q (x) = [x1— 2 (x2 + x3)]? 


3 9 
+35 (x2 — x3}? a: (re + x3}? 


tandis que la matrice M se diagonalise sous la forme : 


3 @ 0 
(os o) 
0 0 —3 


(CN 
Tr (f*) 


det (f*) = det (f) 
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L'exemple de la matrice M montre la conservation de 
la somme des éléments diagonaux, après changement 
de base ; on peut aussi le constater sur l'exemple de matrice 
réductible vu plus haut. Il s’agit encore d‘un invariant, 
appelé trace d'un endomorphisme f, noté Tr (f), égal à la 
somme de ses valeurs propres (l'espace E étant de dimen- 
sion finie, il s'agit là d'une somme finie), ou encore à la 
somme des éléments diagonaux de la matrice représentant 
f dans une base quelconque. 


Algèbre linéaire et groupes de transformation 


Dans ce paragraphe, on va donner une classification 
élémentaire, par la structure de groupe, de quelques types 
de transformations linéaires d'un espace vectoriel E de 
dimension finie sur un corps K. 

Le groupe linéaire GLx (E), ensemble des endomor- 
phismes injectifs (ou automorphismes) de E, muni de la 
loi de composition des applications, est le plus large de 
ceux-ci. C'est à l'intérieur de ce groupe que l'on caracté- 
rise deux sous-groupes particuliers : le groupe ortho- 
gonal et le groupe unitaire. 


Adjoint d'un endomorphisme 

Sur E, soit S une forme bilinéaire symétrique telle que 
les deux applications linéaires partielles soient injectives 
(on dit que S est non dégénérée). Alors, pour toute 
application fe £ (E), il existe un endomorphisme unique 
f* tel que: 


S[If(x),y]1 = S[x,f* (y)] pour tout couple (x, y)EE x E. 


Cet endomorphisme s'appelle l’adjoint de f. Le lien de cette 
notion avec la dualité, que la notation sous-entend, est 
plus net lorsqu'on sait que, relativement à toute base 
(ei):-1, …, n telle que S (e:;, e;) = à; (symbole de Kro- 
necker) — ou base orthonormale relativement à S — 
la matrice M* de f* et celle, M, de f sont liées par: 


M*=iM si K=R et M*—=iM si K=C 


(M désigne la matrice dont les éléments sontles conjugués 
de ceux de M). Les principales propriétés de l'adjoint 
sont résumées dans le tableau I. 


Cr 


Tr (f*) = Tr (f) 


det (f*) = det (f) 


Transformation orthogonale 
On suppose que K = KR, et on cherche à caractériser 
les transformations linéaires qui conservent les distances. 
On dit que fEL (E) est orthogonale relativement à S 
si, pour tout couple (x, y) EE X E,ona: 
S [f (x), (y)1=S (x y). 
Si Q est la forme quadratique associée à S, ceci revient à 
Q [f (x)] = Q (x), pour tout x € E. Alors f et son adjointe 
vérifient fof* =f*of= Id. | 
Par suite f est inversible et f-1 — f*. Ceci justifie donc 
la définition suivante. 
Une matrice À est orthogonale si elle vérifie : 
AXtA=tAX A=l 


Leurs propriétés sont nombreuses. 


ou encore : A7! = tA. 


Propriété 1. Si À est orthogonale, alors |det A] = + 1. 
Lorsque det À = + 1, on dit que la matrice est droite; 
si det A = — 1, la matrice est dite gauche. 


Propriété 2. Si À est orthogonale, toute valeur propre 
k de A vérifie [k| = 1. 

En particulier, les valeurs propres d'une matrice ortho- 
gonale droite d'ordre 3 sont : 1, ef? et e-?7 pour une cer- 
taine valeur réelle de x; c'est-à-dire que l'application 
linéaire associée est une rotation d'angle z autour d'un 
axe À, dont tous les points sont invariants (ce qui explique 
la valeur propre 1). L'application linéaire associée à une 
matrice orthogonale gauche d'ordre 3 est une symétrie 
par rapport soit à un plan, soit à un point. 

Les transformations orthogonales relativement à S 
décrivent un sous-groupe de GL&(E) qu'on note O (n, R) 

i=p 
lorsque S (x, y) = > xiyi (produit scalaire). Lorsque 
ii 
E est un espace vectoriel normé par le produit scalaire 
usuel — on dit que E est un espace euclidien — les 
transformations orthogonales de E sont les isométries 
de E. 


Forme hermitienne 

Le but est ici de reprendre les notions qui ont permis 
la construction du groupe orthogonal, mais lorsque le 
corps de base est C. 

Si E est un espace vectoriel sur €, une application 
h:E x E = C est dite forme hermitienne si les relations 

h (ex + x',y) = ah (x, y) + h (x, y) 

h (a, by + y') = bh (x y) + h (x y) 

h (x y) = h (y, x) 
sont vérifiées pour tous éléments xEeE, yEeE,x'eE, 
y'eE,aeCetbhecC. 

Cette notion étend celle de forme bilinéaire symétrique 
réelle au cas complexe. Dans ce cas, h (x, x) est réel et 
l'application x = h (x, x) s'appelle forme quadratique 
hermitienne associée à A. 

Soit une base (e:);-:, 
définie par : 
hij = h (e:, e;) caractérise la forme hermitienne h, puisque, 

i=p J=P i=pj=p 
six = À. xiei et y = Hs: y5e;, on a h (x, y) = pi D xiÿshy. 
i=1 jæ=l = i=1j=1 
Cette matrice vérifie H — H puisque 


hj = h (e, ei) = h (6j, ei) = hi. 

L'inégalité de Schwarz: |h (x, y)[? < À (x, x) X h (y, y) 
est la propriété de base des formes hermitiennes. 

Une forme hermitienne est dite non dégénérée si la 
matrice H associée est inversible, soit si detH 0 
(lorsque h (x, x) > O pourtoutxEe E, on dit que la forme 
est positive). Alors, la forme quadratique Q associée à h 
définit une application N:E —+ R+, N:x—V0Q (x) qui 
vérifie : 


N(x)=0<x—=0 
N (ax) = x] N (x) sixeC etxeE 
N(x+ty)<N(X+N(y) sixeEetyeE 


et qui s'appelle une norme sur E. Un espace vectoriel 
complexe E, de dimension finie, muni de la norme issue 
d'une forme hermitienne non dégénérée positive est 
appelé espace hermitien. Alors, à toute application 
fEef£ (E) correspond un endomorphisme unique f* 
(adjoint de f) tel que : A [f (x),y] = h[x,f* (y)] pour 


» de E; la matrice H = (h:) 


tout couple (x, y) EE x E, dont les propriétés sont résu- 
mées dans le tableau I. 
Les matrices M de fet M* de f* relativement à toute base 


orthonormale de E sont adjointes : M* = tM. 


Groupe unitaire 

Comme dans le cas du groupe orthogonal, on peut 
montrer que, sur un espace hermitien E, de dimension 
finie, tout endomorphisme bijectif u € £ (E) tel que u = u* 
vérifie aussi: h [u (x),u (y)] = h (x,y)etN [u (x)] = N (x) 
si h est la forme hermitienne qui définit la norme N sur E. 

Un tel endomorphisme s'appelle automorphisme uni- 
taire ; cette dénomination provient du fait que le nombre 
complexe det u est de module égal à 1. Une matrice carrée 
d'ordre n, À, à coefficients complexes, telle que 


A'.A=A.A"=|, soit A*= ‘À — A-1 


est donc appelée matrice unitaire. En particulier, une 
matrice unitaire réelle est une matrice orthogonale. 

Les automorphismes unitaires d'un espace hermitien 
de dimension finie forment un sous-groupe de GLe£ (E), 
le groupe unitaire, que l'on désigne par U (n, ©). 

Parmi les opérateurs unitaires, ceux dont le déterminant 
est exactement + 1 forment un sous-groupe de U (n, C), 
le groupe spécial unitaire noté SU (n, C) ; de même que 
parmi les transformations orthogonales, celles dont le 
déterminant vaut + 1 forment un sous-groupe de O (n, R), 
le groupe spécial orthogonal noté SO (n, R). Plus 
généralement, dans le groupe GLx (E) les endomor- 
phismes dont le déterminant est égal à + 1 (qui sont donc 
des automorphismes de E) forment un sous-groupe, 
le groupe spécial linéaire SL (n, K). 

Le tableau Il schématise les liens entre ces groupes 
d'opérateurs (les flèches rouges symbolisent une inclusion). 

L'extension pour K = € des résultats obtenus pour les 
endomorphismes symétriques est le théorème : pour 
toute matrice hermitienne H, il existe une matrice unitaire U 
telle que la matrice U-1 . H . U soit diagonale. 

On dit aussi que toute matrice hermitienne est diagona- 
lisable dans le groupe unitaire, de même que toute matrice 
symétrique est diagonalisable dans le groupe orthogonal. 


Tableau ll 


Y Tableau II : /jaisons entre 
groupes de transformation. 


Liaison entre groupes de transformation 


GL (n,K) 


SL (n, K) 


déterminant égal à 1 


déterminant égal à 1 


Corps de baseK=R 
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déterminant égal à 1 


Corps de base K = C 


Espaces vectoriels de dimension infinie 

La structure d'espace vectoriel est très riche, les pro- 
priétés des opérateurs linéaires (plus spécialement ceux 
des groupes de transformation cités ci-dessus) offrent 
des applications extrêmement diverses, que ce soit pour 
d'autres développements mathématiques ou pour des 
applications en physique, en statistiques, en écono- 
mie, etc. La simplicité, mais en même temps la richesse du 
concept de linéarité, lui donnent cette importance fonda- 
mentale, et l'utilisation du calcul matriciel, par exemple, 
n'en est certes pas le plus petit aspect. Il est tout de 
même des barrières qu'il faut poser dès que l'on cherche 
à décrire et étudier des espaces vectoriels qui ne sont plus 
de dimension finie. L'outil matriciel, ainsi, n'est plus 
disponible; mais ce n'est pas la seule limitation. La pre- 
mière distinction est celle qui intervient sur les bases 
et plus encore sur la dimension d'un espace vectoriel, 
car bien évidemment la description globale d'un espace 
vectoriel par un nombre fini de ses éléments est excep- 
tionnellement féconde. Tout espace vectoriel de dimen- 
sion p sur un corps K est isomorphe à K?, c'est-à-dire 
qu'il n'y a en fait qu'une seule structure d'espace à p 
dimensions sur K; on ne peut rien dire d'analogue en 
dimension infinie. Puis, dès que l'on s'intéresse aux 
applications linéaires, les différences sont encore plus 
sensibles; une application linéaire n'est plus bijective 
dès qu'elle est seulement injective ou surjective. Les appli- 
cations développées sur le concept de rang ne sont plus 
utilisables lorsque le sous-espace vectoriel f (E) est de 
dimension infinie. Le fossé est très large pour les ques- 
tions de dualité, et tout le schéma de « réciprocité », 
basé sur l'application de E dans E**, ne peut plus être 
utilisé. En particulier, il n'est plus vrai que #(tf) — f, 
ou que rg (#f) = rg f. 

Bien entendu, tous les problèmes des invariants doivent 
être pensés différemment quoique les concepts de base, 
valeurs propres et vecteurs propres restent les mêmes. 
La pratique de leur détermination ne peut plus être systé- 
matisée par les déterminants et les systèmes d'équations 
linéaires ; ce sont des considérations spécifiques à chaque 
problème particulier qui permettent de le résoudre. Plus 
généralement, c'est toute la théorie spectrale qui est à 
reconstruire, mais il faut cette fois de nouveaux outils. 

C'est avec la topologie et l'analyse moderne que l'on a 
pu poursuivre l'étude des espaces vectoriels de dimension 
infinie : espaces vectoriels topologiques et surtout espaces 
de Hilbert. Les espaces de fonctions ont, en effet, fourni 
les plus nombreux exemples d'ensembles sur lesquels on 
définit aussi bien une structure linéaire qu'une structure 
métrique avec un produit scalaire et même une norme : 
ensemble des fonctions continues sur un intervalle fermé 
borné de R; ensemble des fonctions intégrables au sens 
de Lebesgue ou bien surtout ensemble des fonctions 
de carré intégrable, au sens de Lebesgue, noté £?, qui 
par passage à l'ensemble quotient par une relation d'équi- 
valence donne l'espace de Hilbert L2. 


Nouvelles tendances de l'algèbre linéaire 


La notion d'espace vectoriel sur un corps cède la place 
à celle, plus générale, de module sur un anneau A ou 
encore A-module. La définition s'obtient en remplaçant, 
dans celle d'un espace vectoriel sur un corps K, le corps K 
par l'anneau A. On voit ainsi qu'un anneau unitaire peut 
être envisagé comme un module sur lui-même. 

On définit de même les bases d'un module mais, et là 
se trouve une première différence fondamentale, tout 
module ne peut être muni d’une base; par exemple le Z 
module 7/27. Un module qui admet une base est dit 
module libre. 


Module libre 

Les morphismes de modules sont encore appelés appli- 
cations linéaires. Les différentes propriétés des anneaux 
entraînent une classification variée des modules : selon 
que l'anneau est intègre, principal, etc. 

Un module M sur un anneau intègre A est dit sans torsion 
si ax=0(a€e A et xe M) implique a = O0 ou x = ©. 
Cette classe de modules s'est révélée avoir de nombreuses 
propriétés. Ainsi, si À est un anneau principal (anneau 
intègre, unitaire et dont tout idéal est principal, c'est-à-dire 
engendré par les multiples d'un seul élément), et si M 
est un A-module de type fini (qui admet un système géné- 
rateur fini) et sans torsion, alors M est un module libre. 
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La seconde hypothèse est ici fondamentale, car, par exem- 
ple, Q est un Z module sans torsion, mais non libre. 

Soit À un anneau intègre et K le corps obtenu par les 
quotients d'éléments de À (corps des fractions de A). 
Si l'on a un A-module libre M, on peut considérer 
l'espace vectoriel sur K, engendré par M. Alors pour tout 
sous-module M° de M, on peut chercher le nombre 
maximal d'éléments linéairement indépendants dans M': 
ce nombre — dimension du sous-espace engendré par 
M' — est appelé le rang de M’. Dans le cas d’un sous- 
module libre dont une base possède p éléments, le rang 
est alors égal à p. Le résultat fondamental s'énonce par le 
théorème qui suit. 

Théorème. Soit À un anneau principal, M un 
A-module libre de rang fini p. Si M' est un sous-module. 
de M, M' est libre et de rang fini r < p. D'autre part, on 
peut trouver une base (ex, 62, …, e») de M, un entier 
r < p et des éléments non nuls a1, 42, …, a, de A tels que: 


(a1e1, 8262, …, arer) soit une base de M' 
ai divise à; +1 pour / = 1,2,...,r—1. 


L'importance de cette structure de module est très 
grande. Les anneaux nœæthériens généralisant les anneaux 
de Dedekind, dans de multiples applications de l'algèbre 
(ainsi en géométrie algébrique), jouent un rôle fondamen- 
tal. Il y a là, comme pour les espaces vectoriels, un effort 
pour la linéarisation des problèmes. Pour ne pas rentrer 
en détail dans ce domaine qui demanderait de longs 
développements explicatifs, on définira ici seulement les 
modules et anneaux nœthériens. 

Soit À un anneau; un A-module M est dit nœthérien 
si tout sous-module de M est de type fini. Toute suite 
croissante de sous-modules est alors stationnaire, c'est-à- 
dire reste fixe au-delà d'un certain rang. Par conséquent, 
toute famille non vide de sous-modules de M possède un 
élément maximal. On dit qu'un anneau A est nœthérien 
si, lorsqu'on le considère comme un A-module, c'est un 
anneau nœthérien; un anneau principal est donc nœthé- 
rien. Il s'agit là d'un outil très important pour l'algèbre 
non commutative et la théorie des nombres. De nombreux 
développements sont dus à des mathématiciens contem- 
porains : Eilenberg, Krull, Mac-Lane. 

Il faut citer encore l'a/gèbre homologique dont l'origine 
vient des théories de l'homologie et de l'homotopie, et 
dont une importante application est justement de déter- 
miner la limite des propriétés des modules par rapport 
à celles des espaces vectoriels; pour cela, on définit 
des modules associés à un A-module donné M, et qui se 
réduisent à {0} lorsque A est un corps. Les travaux de 
Henri Cartan et d'Alexandre Grothendieck ainsi que de 
Samuel Eilenberg ont largement fait progresser cette 
branche que l'on peut maintenant considérer comme 
autonome. 
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LES ÉQUATIONS ALGÉBRIQUES 


La résolution des équations algébriques a certaine- 
ment été l'origine de développements parmi les plus 
importants des mathématiques. Les méthodes de recher- 
che des solutions de telles équations, dès que le degré 
est supérieur à l'unité, ont fait intervenir de tout autres 
concepts que ceux utilisés pour les équations linéaires. 
Longtemps, les algébristes ont cherché à inclure l'extrac- 
tion des racines n-ièmes parmi les opérations élémentaires 
de l'algèbre. En cherchant dans cette voie, ils parvinrent 
à résoudre les équations de degrés 2, 3 et 4, mais on dut 
attendre le XIX° siècle pour dresser une résolution 
d'ensemble des équations par la notion des groupes de 
Galois dont une très importante application est le théo- 
rème d’Abel sur la résolubilité des équations par radicaux. 
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Pedicini 


La méthode affine 

Les équations du premier degré, grâce à l'outil formel 
de l'algèbre linéaire, se résolvent sans aucun problème. 
Sur un ensemble E, muni de deux lois — notées additive- 
ment et multiplicativement — qui lui confèrent une struc- 
ture d’anneau, la recherche des éléments X tels que 
AX = B, où À et B sont donnés dans E, revient à la 
recherche de l'élément A71, inverse de À, lorsqu'il existe, 
ou sinon à un problème déjà expliqué dans le cadre des 
espaces vectoriels et qui se transpose aisément dans le 
cadre des modules sur un anneau : on interprète l'élé- 
ment À comme une application linéaire de E dans lui- 
même, et l’on recherche tout d'abord l'ensemble des 
éléments images puis leurs « translatés » par l'élément B. 

La méthode affine, qui est ainsi brièvement résumée, 
couvre entièrement la résolution des problèmes linéaires. 
Les techniques matricielles ont permis de dresser des 
méthodes algorithmiques complètes de résolution des 
équations du premier degré. 


Le second degré 


Le saut est alors très grand pour passer aux équations 
de degré supérieur; jusqu'ici, les équations linéaires 
n'utilisent que les opérations fondamentales définissant 
la structure, tandis que, dès le second degré, on voit appa- 
raître l'extraction de radicaux. Dans l'équation 


az? + bz+—c—0 oùa O0, 
l'étude du discriminant À — b?— 4 ac permet de distin- 
guer les trois cas bien connus (a, b, c sont des nombres 


réels). 
Lorsque À > 0, on peut écrire : 


— b + JA —b— JA | 
a (2 53 } (2 +: ) (e] 


d'où l’on déduit l'existence de deux racines réelles dis- 
tinctes. 


sn DAS rs 
Lorsque À = 0,onaalorsa (z + >) = 0,etl'équa- 
tion possède une racine double réelle. 
Lorsque À < O0, on a recours à la construction des 
nombres complexes pour écrire : 


2a 


C'est à l'Italien R. Bombelli que l'on doit le premier 
exposé sur les nombres complexes, contenant des règles 
de calcul; cet exposé contient d'ailleurs en germe de 
nombreux concepts d'algèbre linéaire. 

Les deux racines sont alors deux nombres complexes 
conjugués. Les règles de calcul sur le corps C permettent 
la généralisation immédiate du procédé de résolution de 
az? + b+ c— O0 lorsque a, b, c sont des nombres 
imaginaires. 


Équations de degrés 3 et 4 


La forme générale : ax3 + bx? + cx + d = O0 (1) de 
l'équation du troisième degré peut se ramener à celle, 
plus simple, (2) z3 + pz + q = O où p et q sont des 
expressions rationnelles de a, b, c et d': 

__—b? + 3 ac dt __2b3— 9 abc + 27 ad 
F— us 27 a 


; b . Dane 
Il suffit pour cela de poserz = x + 33 après avoir divisé 


les deux membres de l'équation de départ par le terme a, 
supposé non nul (sinon l'équation serait de degré 2). 

C'est au début du XVI® siècle que Scipion del Ferro 
trouve alors la formule de résolution : 


3 =— 7 3 

a des JE EE ne ie g,r 

2 NT 7 2 Nr 7 
Cette sensationnelle découverte relança, à travers des 
querelles d'écoles, les recherches sur les équations. 
Hyeronimus Cardan (1501-1576), après Nicolas Tartaglia, 
en 1545, publie les formules de résolution qu'il complète 
en formulant quelques observations. || remarque ainsi 


que les équations du troisième degré peuvent avoir trois 
racines; que la somme des racines de (1) est toujours 


b 
égale Le La méthode de Cardan pour résoudre (2) 


consiste à poser z = y + #, ce qui donne 
++ (Syt+p) (y +0 


g= 0; 
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Pineider 


À À gauche, une page 
manuscrite de l'Algèbre 

de R. Bombelli, 
mathématicien italien à qui 
l'on doit le premier exposé 
sur les nombres complexes, 
contenant des règles 

de calcul. 

À droite, Nicolas Tartaglia 
à qui l'on doit. notamment 
les formules de résolution 
pour l'équation générale 
du troisième degré. 
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On cherche alors les racines de cette nouvelle équation 
telles que 3 yt — p = 0; on a donc le système : 


YS+—=—q 

p 

= 

5 3 

En posant alors « — yet 8 — 13, ona: 

p3 
atB—— et ile 
8 q a 57 


Les nombres « et 8 sont donc racines de l'équation du 
second degré en uv: 
3 


(3) + qu— = 


Par suite si y représente l'une des trois déterminations du 
3 FR, L ci = : . 

nombre Ya, et 1, j, j? les trois racines cubiques de l'unité, 

les trois valeurs possibles pour y sont y, jy et /?2y. Puis 


p 
det— ——, 
3y 
respondantes pour t: 


2 ; 
ER à 
3+ 3y 3 y 
Par conséquent, les solutions de (2) sont: 
:p:. Lu + HP mn 80 — PE 
ge bee ae 
La discussion porte sur les racines de l'équation (3), 
3 
dont le discriminant est : À — a(f+Ë) Lorsque 


0. 


on obtient les trois valeurs possibles cor- 


Z1=Y— 


2 ps 
Tes T3 > 0 pour l'équation (2), on a une racine réelle et 


deux autres complexes conjuguées : 


gd... : 
— lorsque T + 3 < 0, l'équation (2) admet trois 
Ror. racines réelles ; 
| Put i 
— lorsque + 5 — on trouve deux racines 


\\ À Th somrcre en 
_ FRANCOIS 
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réelles, dont une double. 

Malgré son intérêt, cette méthode est peu employée; 
on lui préfère des méthodes numériques, faisant appel, par 
exemple, à la trigonométrie. 

C'est un élève de Cardan, Luigi Ferrari, qui, en 1545, 
énonce la règle pour résoudre l'équation générale du 
quatrième degré : 


(4) 


Auparavant, l'équation bicarrée y4 + my?+ n = O0 avait 
été longuement étudiée et Cardan avait remarqué qu'elle 
pouvait avoir quatre racines. La voie est alors ouverte plus 
largement encore avec les travaux de Viète sur les rela- 
tions entre coefficients et racines d'une équation algé- 
brique, puis ceux de Girard (1595-1632) qui prolonge 
l'idée — énoncée par Cardan — de l'ordre de multiplicité 
d'une racine, et va aboutir au célèbre théorème de Gauss- 
d'Alembert. 

La méthode de Ferrari transforme l'équation de départ, 
du quatrième degré, en une équation du troisième degré, 
théoriquement résoluble. Comme pour le second degré, 
on considère le premier membre de (4) comme le début 
du développement d'un carré parfait dont un terme est 
inconnu, et on a: 


(e+ 5x+ à 


DE }k LP © | 
— x? ss —1r|x- s| = 0 
[Ce DA met DES 
Il suffit alors de chercher à déterminer t de telle sorte 
que le crochet soit un carré parfait, pour que l'on n'ait 
plus à résoudre que deux équations simples du second 


degré. Cette condition est réalisée dès que le trinôme 
entre crochets admet une racine double, soit si : 


RS 


X8 px8 + gx? rx + s = 0 


À Frontispice de l'Algèbre nouvelie de F. Viète, maître des Requêtes 


de l'Hôtel du Roi (1540-1603); il fut un des grands mathématiciens de son siècle. et l'on reconnaît là une équation du 3° degré en t. 
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La résolution des équations de degré supérieur à 
quatre posa dès lors un problème à tous les mathémati- 
ciens qui ont longtemps essayé de poursuivre, avec le 
5e degré, les méthodes de résolution par radicaux. L'obs- 
tacle fut infranchissable, et, vers la fin du XVIIe siècle, 
Leibnitz est encore l’un des derniers à se préoccuper de 
ce problème. Une longue période de tâtonnements s'ou- 
vrait alors, et ce sont les recherches de Lagrange (1736- 
1813) qui vont dégager, à partir des relations entre coeffi- 
cients et racines, la voie que Galois (1811-1832) va 
prendre pour résoudre d'une façon globale le problème 
des équations algébriques. 


Polynômes 


On désigne par K un corps commutatif, et par K [X] 
l'anneau des polynômes à une indéterminée à coefficients 


Le] 
dans K, c'est-à-dire des expressions de la forme Y anX? 
n=0 
où tous les scalaires a, du corps K sont nuls à partir d'un 
certain rang. On rappelle qu'un idéal | d'un anneau A 
est un sous-groupe additif de À tel que, si XEA et 
ye I, alors Xy € I. Par conséquent, tout idéal est un sous- 
anneau (la réciproque étant fausse). Dans l'anneau K [X], 
les idéaux possèdent des propriétés très particulières, 
dont la plus importante est sans nul doute d'être princi- 
paux : c'est-à-dire que pour tout idéal j « K[X], on 
peut trouver un polynôme P € 3 tel que tout élément de J 
soit un multiple de P par un élément de K [X] ; donc pour 
tout Qe dj, il existe un polynôme A € K [X] tel que 
Q = P: À. Ce polynôme P est unique à une constante 
multiplicative près. Celui dont le coefficient du terme de 
plus haut degré est 1 est dit base de l'idéal. 
On dit qu'un idéal 3 est premier si la condition : 


A-Bej=AEeÏj oubienBEej. 


On peut rapprocher cette définition de celle d’un poly- 
nôme p (X) irréductible si : 


pDH=IDrD=gX=cERK 
ou bienr (X)=cek. 


On montre d'ailleurs que si un idéal j est premier, son 
polynôme de base est irréductible, et réciproquement. 

Soit L un corps contenant le corps K, on dit que L est 
un sur-corps de K; par exemple, C est un sur-corps de R 
qui est lui-même un sur-corps de Q. La loi externe définie 
par: (/, k) 1: koù/EL et kEK, donne à L'une structure 
d'algèbre sur K; on dit alors que L est une extension de K, 
par exemple C est une extension de R. Soit alors «€ L, 
à tout polynôme f (X) e K[X], on peut faire corres- 
pondre le scalaire f (x) € L; et lorsque f (X) décrit K [X], 
les f (x) correspondants décrivent un sous-anneau de L, 
dit engendré par K et x, et que l'on note K [x]. 

En reprenant la même construction, mais cette fois avec 
le corps K (X) des fractions rationnelles en X à coeffi- 
cients dans K, quotient de deux polynômes de K [XI], 


FX 

g (© 
considérant les scalaires f (x)/g (x) pour tous les poly- 
nômes f (X) e K [X]Jetg (X) € K [IX] tels que g (&) Æ 0; 
on l'appelle sous-corps engendré par K et « et on le note 


K (x). On remarque tout de suite que si «€ K, alors 
K (a) = KetsixéK,K (x) = K. 


soit sie L, on obtient un sous-corps de L en 


Définition 

Le sur-corps L de K est une extension simple de K, 
s'il existe un élément « € L tel que L = K (x). 

Ce sont ces extensions qui permettent de rechercher 
l’ensemble des racines d’une équation algébrique : on 
considère un polynôme  (X) irréductible sur un corps K, 
et on va chercher un sur-corps de K dans lequel f (X) 
possède une racine. 


Définition 

Soit L— K (x) une extension simple de K. Elle est 
transcendante sur K s’il n'existe aucun polynôme f (X) 
non nul, à coefficients dans K, tel que f (x) = O0. Elle 
est dite algébrique dans le cas contraire. Ce sont évidem- 
ment les extensions algébriques simples qui vont per- 


mettre l'étude des équations algébriques. Leurs propriétés 
sont très larges. 

On montre que, si K (x) est algébrique simple, 
alors le corps K (x) est égal à l'anneau K [x]. Ceci permet 
de voir que toute extension algébrique simple K (x) est 
isomorphe à l'anneau quotient de K [X] par l'idéal des 
polynômes multiples d'un certain polynôme irréductible 
normé (c'est-à-dire dont le coefficient du terme de plus 
haut degré est égal à l'unité). Soit d le degré de ce poly- 
nôme irréductible ; alors tout élément z de & (x) se met 
de façon unique sous la forme : 


Z = 40 + 41% + aa-iud 1 


où a; € K pour tout /. 

En effet, puisque ze K (x), ze K[«], donc on peut 
trouver un polynôme f tel que z = f (x). Soit p (X) le 
polynôme irréductible de degré d. La division de f (X) 
par p (X) s'écrit : f (X) = q (X) p (X) + r (X) avec r (X) 
polynôme de degré inférieur à d, ou bien r (X) = O. 
Par conséquent, f (x) — r (x) puisque p (x) = 0. On a 
donc bien une représentation du type indiqué pour z. 

On reconnaît donc que K (x) est un espace vectoriel 
sur K, de dimension finie, égale à d. Ce nombre s'appelle 
le degré de l'extension K (x) et se note d = [K (x) : K]. 
Les extensions transcendantes simples de K sont, par 
contre, des espaces vectoriels de dimension infinie sur K. 

Le corps des nombres complexes € est une extension 
de degré 2(ou encore quadratique), soit R (i) du corps 
des réels R, le polynôme irréductible associé étant x2 + 1; 
et l'on sait bien que les éléments de C s’écrivent de façon 


unique a + bi. Le corps Q (42) dont les éléments se repré- 


sentent par a + b {2 (où a € Q et b € Q), est une exten- 
sion quadratique du corps À des nombres rationnels, le 
polynôme irréductible associé étant x? — 2. 

Si maintenant on se donne un polynôme p (X) € K [X] 
irréductible sur K, on cherchera donc une extension algé- 
brique simple K (x) dont le polynôme irréductible associé 
soit p (X), afin de trouver une racine de p (X) dans ce 
sur-corps. 

L'étude qui vient d'être faite montre que le corps 
K[X]/(p (X)) satisfait aux conditions imposées, en 
désignant par (p (X)) l'idéal des polynômes multiples 
de p (X). Cette construction permet de définir un sym- 
bole «x, racine d’un polynôme irréductible sur K. On peut 
noter que l'extension cherchée est unique à un isomor- 
phisme près laissant les éléments de K invariants (on dit 
un K-isomorphisme). 

On donne à cette construction le nom justifié d'adjonc- 
tion symbolique. C'est ainsi que Cauchy construisit 
les nombres complexes par le corps quotient 


R [XJ/(X2 + 1). 


Il faut bien sûr rapprocher ces notions d'extensions 
algébriques ou transcendantes de celles de nombres 
algébriques ou transcendants sur un corps K, le parallé- 
lisme entre les définitions étant évident. 

L'adjonction symbolique que nous venons de définir 
montre donc que, si l'on se donne un corps K, un poly- 
nôme p (X) irréductible dans K, alors il existe une exten- 
sion algébrique simple (de degré fini) L telle que, si p (X) 
possède une racine dans L, il en possède m (si m est le 
degré de p (X)) ; autrement dit, telle que p (X) s'y décom- 
pose en facteurs irréductibles de degré 1. Une telle exten- 
sion est dite galoisienne. 

Il s'agit là de l’une des notions de base posées par Galois 
pour sa théorie des équations algébriques. C'est Lagrange 
qui lui avait ouvert la voie en observant sur les exemples 
d'équations de degrés 3 et 4 le grand intérêt de l'étude du 
nombre N de valeurs prises par une fonction rationnelle 
des racines lorsque l'on permute celles-ci. Il définit les 


«résolvantes de Lagrange » : 
n 


Zp = > xx, 
k=i 

où x1, X2, … Xn désignent les n racines d'une équation 
algébrique de degré n et (wp)p= 1,...,n les racines n-ièmes 
de l'unité, et montre dans un très célèbre mémoire que la 
détermination des racines xx est assurée dès que l'on 
connaît les nombres z,. Un mémoire de Vandermonde 
(1735-1796), mathématicien français, dont les résul- 
tats ne furent entièrement démontrés que par Carl 
Friedrich Gauss (1777-1855), complète les recherches 
de Lagrange. 
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Le mathématicien 
norvégien Niels-Henrik Abel 
(1802-1829); il montra 

que les équations 
algébriques générales 

ne peuvent pas être résolues 
algébriquement quand leur 
degré est supérieur 

au quatrième. 


Palais de la Découverte - Paris 


Groupes de Galois — Théorème d'Abel 


On rappelle qu'une permutation d'un ensemble E est 
une bijection de E sur E. Lorsque E est un ensemble fini, 
on représente une permutation par un tableau à deux 
lignes, chaque élément de la ligne supérieure étant placé 
au-dessus de son image. L'ensemble des permutations 
d'un ensemble fini, muni de la loi de composition usuelle 
des applications, forme un groupe, que l'on appelle le 
groupe symétrique. 

Soit K un corps et L une extension galoisienne de K. 
Les automorphismes de L qui laissent K invariant (auto- 
morphies par rapport à K, de L) forment un groupe, qui 
est le groupe de Galois de L par rapport à K. C'est à Julius 
Dedekind (1831-1916) que l'on doit cette définition 
remplaçant celle du groupe de permutations des racines 
d'une équation telle que Galois, en 1830, l'avait énoncée. 
Le lien entre ces deux formes s'établit comme suit : 
si p (X) est un polynôme irréductible dans un corps K, 
les racines X1, x2, …, x, de ce polynôme engendrent une 
extension galoisienne L de K. Soit G le groupe de Galois 
de L par rapport à K; si f est un élément de G, toute racine 
de p (X) est transformée par f en une autre racine. Par 
conséquent, f induit sur les racines de p (X) une permu- 
tation qui, réciproquement, détermine f. 

Soit alors g (X) un autre polynôme irréductible dans 
K et M l'extension de K construite à partir des zéros 
Y1, Y2, …, Ya de g (X). On voit alors que, lorsque la réso- 
lution de p (X) = 0 donne celle de g (X) = 0, les racines 
de qg (X) sont des expressions rationnelles de celles de 
p (X), donc sont des éléments de L; par suite, M est 
un sous-corps de L. Le principe de Galois consiste à 
construire ces corps intermédiaires échelonnés entre 
K et L. Soit T un de ces corps, alors les T-automorphismes 
de L forment un sous-groupe H de G. Réciproquement, 
soit H un sous-groupe de G; les éléments de L invariants 
par les automorphismes de H forment un sur-corps S de 
K. On a donc construit une correspondance entre les 
corps intermédiaires entre K et L et les sous-groupes de G, 
et une autre en sens contraire. C'est là que le théorème 
fondamental de Galois se place en montrant que ces deux 
correspondances sont réciproques. C'est-à-dire que, 
si T est un corps intermédiaire et si H est le groupe des 
T-automorphismes de L, alors T est aussi le sous-corps 
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de L formé par les éléments invariants par tous les élé- 
ments de H. Donc, si H est un sous-groupe de Get siT 
est le corps formé par les éléments invariants par les 
éléments de H, alors H est aussi le groupe des T-auto- 
morphismes de L. Pour cette raison, on dit que le corps T 
et le groupe H sont associés. 

La théorie de Galois permet de résoudre le problème 
de la résolubilité des équations radicaux, qui consiste à 
trouver une expression formée des quatre opérations et de 
l'extraction de racines p-ièmes qui soit solution d’une 
équation p (X) = 0, algébrique. On a pu ainsi trouver la 
condition générale pour qu'une équation soit réso- 
luble par radicaux. 

Soit donc un corps K et un polynôme irréductible dans 
K, p (X). Chaque racine de p (X) construite par radicaux 
est algébrique sur K : elle est racine d’un polynôme q (X) 
irréductible dans K. Soit L l'extension de K construite à 
partir de ces radicaux (racines de p (X)) et de tous les 
autres zéros des polynômes g (X); soit G le groupe de 
Galois de cette extension, qui est galoisienne. Les racines 
de p (X) sont dans L, et engendrent un corps M inter- 
médiaire entre K et L. On sait qu'on peut associer à M 
un sous-groupe H de G, et que le groupe de Galois de 
l'extension L est alors G/H. 

Le mathématicien norvégien Niels-Henrik Abel (1802- 
1829) a démontré que les groupes de Galois engendrés 
par des radicaux possèdent la propriété dite de résolubilité : 
c'est-à-dire qu'il existe une suite de sous-groupes 
G1 (= G), G2, …, Gr -1, Gr (= {1}) commencant par G, 
finissant par le groupe formé du seul élément unité (dit 
groupe unité), tels que chaque G; soit un sous-groupe 
distingué de G;-1 (c'est-à-dire G; G;:-1 G;1 € Gi), 
le groupe quotient G; -1/G; étant cyclique (c'est-à-dire 
fini et engendré par un seul élément). On montre ainsi 
que le groupe des permutations d'un ensemble à 3 élé- 
ments est résoluble ; de même le groupe — à 24 éléments — 
des permutations d'un ensemble à 4 éléments est réso- 
luble : il est engendré en fait par les permutations : 


_ _fabcd\ ___fabcd\ ___fabcd 
ae (dc) 2 (bcad} "3 \bacd 
et si 
G3 — 


l'on pose G2— groupe engendré par z1 et me, 
groupe engendré par 71 et 7x2 #1 #3 1, 


abcd 
bacd 
et G4 = groupe engendré par 71, alors la suite G, G>, 


abcd 
abcd 


vérifie les conditions énoncées, les groupes quotients 
ayant pour ordres respectifs 2, 3, 2, 2. 

Si maintenant on en revient au problème de départ, 
on voit (théorème d'Abel) que, pour qu'une équation 
algébrique soit résoluble par radicaux, il faut et il suffit 
que son groupe de Galois soit résoluble. 

Il est donc maintenant évident que toute équation de 
degré 3 est résoluble par radicaux (précédemment, on a 
donné les formules explicites de Cardan), et qu'il en est 
de même pour toutes les équations de degré 4. 

L'étude du groupe de permutation d'un ensemble à 
n éléments, pour n > 5, que l'on ne peut faire ici en détail, 
montre qu'il n'est en général pas résoluble (à moins 
d'imposer des conditions restrictives sur l'équation). Le 
théorème d'Abel montre donc qu'une équation de degré 
supérieur ou égal à 5 ne peut en général être résoluble 
par radicaux. 

Ce théorème met donc ainsi un point final à ce très vieux 
problème pour lequel les plus grands mathématiciens ont 
essayé les plus diverses des méthodes pour trouver une 
solution. C'est d'ailleurs en essayant de résoudre par 
radicaux l'équation de degré 5 qu'Abel se convainquit 
de l'impossibilité de le faire et, reprenant la voie ouverte 
par Lagrange — sur les permutations des racines dans leurs 
expressions rationnelles — énonca son résultat en utilisant 
l'extraordinaire théorie de Galois. 


[on rappelle que 7371 — 


G3, Ga, 6 où 6 est formé par la seule r0 — ( 


BIBLIOGRAPHIE 


DUBREUIL-JACOTIN P. et M. A/gèbre, Dunod. - 
GALOIS É., Œuvres, Gauthier-Villars. - LANG S., A/gèbre. 
- SAMUEL P., Théorie algébrique des nombres, Hermann. 


Pineider 


GÉOMÉTRIE 


LA 


La géométrie, comme son nom l'indique, naquit du 
besoin pratique de mesurer des parcelles de terrain. 
Il est certain que déjà les Égyptiens avaient trouvé des 
méthodes de mesure et avaient même élaboré un début de 
science géométrique. La tradition veut que la géométrie 
grecque naisse vers le VIe siècle av. J.-C. avec Thalès 
de Milet. Elle s'est ensuite progressivement affinée et 
développée avec Pythagore, au Ve siècle, Eudoxe, au 
IVe siècle, qui obtinrent un nombre appréciable de résul- 
tats géométriques : inscription de sphères dans un cône, 
similitude des triangles, principales propriétés du cercle, 
polygones et polyèdres réguliers, sections coniques. 
En utilisant et en complétant ces résultats, Euclide (fin du 
IVe siècle av. J.-C.) réalisa avec ses Éléments la première 
synthèse de la géométrie. Il eut le souci de fonder la géo- 
métrie et donna un exemple important d'élaboration d'un 
système axiomatique. Aujourd'hui, les fondements de ce 
système se révèlent très peu assurés. C’est seulement 
à la fin du XIX® siècle — et surtout avec D. Hilbert — que 
la géométrie euclidienne fut fondée de façon satisfai- 
sante. 

D. Hilbert, dans son livre Grundlagen der Geometrie 
(1899), donna la première construction axiomatique qui 
ne devait rien à l'intuition. Le système d'axiomes utilisé 
est divisé en cinq groupes; la grande originalité de son 
œuvre est que le contenu concret, ou conceptuel, n'est 
pas présupposé, mais est introduit par la formulation 
des axiomes. D'autre part, D. Hilbert formula les conditions 
auxquelles doit obéir un système d'axiomes pour être 
satisfaisant cohérence, indépendance, saturation. Il 
établit l'indépendance du postulat d'Euclide sur les paral- 
lèles par rapport aux autres axiomes et prouva aussi qu'on 
peut construire des géométries non contradictoires en 
conservant tous les axiomes euclidiens, sauf celui des 
parallèles. 

Aujourd'hui, la géométrie comporte un domaine de 
recherche immense, allant de la géométrie plane aux 
géométries à n dimensions, de la géométrie classique aux 
géométries définies par un groupe de transformations 
(selon le Programme d'Erlangen de F. Klein), de la géo- 
métrie algébrique à la géométrie différentielle et à l'ana- 
lysis situs ou topologie. 
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La géométrie élémentaire 


La géométrie plane 
Les axiomes 

En géométrie plane, on considère un ensemble de base 
appelé p/an. Les éléments de cet ensemble sont appelés 
points. Une partie quelconque d'un plan se nomme une 
figure. 

D. Hilbert parvint le premier à formuler une trentaine 
d'axiomes qui, non seulement, introduisent des relations 
entre le plan et certaines de ses figures, mais encore cons- 
truisent le plan et définissent les figures fondamentales. 

Ces axiomes se divisent en cinq groupes : 
axiomes d'appartenance, 
axiomes d'ordre, 
axiomes de congruence ou d'égalité, 
axiome des parallèles (ou d'Euclide), 
axiomes de continuité. 

e Les axiomes d'appartenance expriment les relations 
d'appartenance et d'inclusion entre points, droites et 
plans; par exemple : « par deux points passe une droite 
et une seule » (fig. 1). 


1.G.D.A. 
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< Deux pages extraites 
des Éléments d'Euclide, 
œuvre qui peut être 
considérée comme 

l'une des premières 
synthèses de la géométrie. 


<« Figure 1 : 1) deux points 
distincts déterminent 

une droite; 2) trois points 
distincts n'appartenant 
pas à une même droite 
déterminent un plan; 

3) si deux points d'une 
droite appartiennent 

à un plan, alors la droite 
appartient à ce plan; 

4) l'ensemble des droites 
d'un même plan sécantes 
en un point S, forme 

un faisceau de centre S. 


A}> À gauche, figure 4 — 

une droite coupant 

deux droites 

coplanaires, détermine 

des angles : alternes- 

externes (1-VII et IV-VI); 

alternes-internes 

(!1-VIII et HI-V); 

correspondants (I-V, 

I-VL IV-VIII et HI-VI) ; 

internes conjugués 

(!I-V et !I-VHI) ; 

externes conjugués 

(I-VI et IV-VII). 

A droite, figure 2 : 

1) /e segment AB; 2) deux 

segments consécutifs; 

3) deux segments adjacents ; 

4) une demi-droite 

d'origine O ; 5) axiome 

de Pasch; 6) P et Q 

appartiennent au même 

demi-plan de bord r, 

Q et R appartiennent 

chacun à un des demi-plans 

de bord r et il existe alors 
un point r entre Q et 

Y Ci-dessous, figure 5 — 

triangles : 1) angle externe 

à un angle d'un triangle; 

2) triangle équilatéral; 

3) triangle isocèle. 

En bas, figure 7 : un angle 

externe d'un triangle est 

égal à la somme des angles 

internes non adjacents. 
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a 


angles concave et convexe 


angles opposés 
par le sommet 


angles adjacents angles droits 
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e Les axiomes d'ordre précisent l'emploi et les proprié- 
tés du mot « entre »; par exemple : « sur la droite définie 
par deux points distincts À et B, il existe au moins un 
point C situé entre ces deux points (et donc au moins 
une infinité dénombrable de points) »; l'axiome de Pasch 
affirme que : « si À, B et C sont trois points non alignés, 
et r, une droite de leur plan telle qu'aucun des trois points 
ne lui appartienne, alors 7 coupe deux ou aucun des seg- 
ments parmi les segments AB, BC et AC » (le segment AB 
est constitué, par définition, de À et de B et des points 
situés entre À et B) (fig. 2). 

e Les axiomes d'égalité expriment les propriétés de 
l'égalité géométrique, sans recours à l'intuition du dépla- 
cement des objets indéformables. L'égalité géométrique 
ne doit pas être confondue avec la notion d'égalité de la 
logique et de la théorie des ensembles : deux segments 
distincts peuvent être égaux, pourvu qu'ils appartiennent 
à la même classe d'équivalence (l'égalité étant ici une 
relation d'équivalence) ; on parlera plutôt par la suite de 
figures isométriques que de « figures égales »; ce quali- 
ficatif, qui évoque une égalité de mesure, sera justifié plus 
loin. En considérant une classe de segments deux à deux 
égaux, on arrive au concept de /ongueur, et en considé- 
rant une classe d'angles deux à deux égaux, on arrive au 
concept d'amplitude angulaire (fig. 3). 

e L'axiome des parallèles. On peut tirer des axiomes 
précédents que, par un point À extérieur à une droite r, 


‘ il est possible de mener une droite qui ne coupe pas r. 
Par définition, deux droites parallèles sont deux droites 
: coplanaires qui ne se coupent pas. 


Axiome d'Euclide : soit une droite r et À un point 
extérieur à r, dans le plan déterminé par r et À, il existe, 
au plus, une droite qui passe par À et qui ne coupe pas r. 

Il résulte de ce qui précède et de ce dernier axiome 
que, par un point extérieur à une droite, il passe une unique 
parallèle à cette droite. L'introduction de cet axiome des 


? parallèles simplifie les fondements de la géométrie et 
- allège considérablement son élaboration. 
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On démontre notamment que deux droites coplanaires 
formant avec une autre droite qui les coupe des angles 
alternes-internes égaux sont parallèles; ou encore 
que deux droites coplanaires formant avec une autre droite 
qui les coupe des angles conjugués supplémentaires 
(leur somme est égale à un angle plat) sont parallèles; 
ou encore des angles correspondants, ou alternes-externes, 
égaux (fig. 4). 

On démontre aussi que des segments parallèles qui ont 
leurs extrémités sur deux droites parallèles sont égaux; 
que si deux droites sont parallèles, toute droite perpendi- 
culaire à l’une est perpendiculaire à l'autre. 

e Les axiomes de la continuité précisent enfin les 
conditions de passage à la limite dans l'espace et de 
mesure des grandeurs. L'axiome d'Archimède permet 
l'introduction de la continuité en géométrie : « Entre deux 
points À, B d'une droite, choisissons un point A1 et déter- 
minons des points distincts Az, As, …., tels que les segments 
AA, A1A», A°A3, … soient égaux; il existera toujours un 
point À; tel que B soit situé entre A et A. » On peut écrire 
aussi l’axiome d'Archimède pour les angles. Les axiomes 
et postulats euclidiens ont été reconnus insuffisants pour 
justifier les raisonnements des « éléments » fondés sur la 
continuité et sur l'ordre; ce qui amena Dedekind, Cantor, 
Weïerstrass, vers 1870, à formuler un postulat de la 
continuité de la droite, et d'autre part Pasch à introduire 
le postulat d'ordre à travers les axiomes de la géométrie. 


Correspondance biunivoque -— Figures isométriques 

Par définition, deux figures sont dites /sométriques 
(ou égales) s'il existe entre elles une correspondance 
ponctuelle biunivoque, appelée aussi /sométrie, telle que 
les segments et les angles déterminés par les points qui se 
correspondent soient toujours égaux. Si les correspondants 
de trois points À, B, C sont respectivement A’, B’, C’, on 
appelle correspondant ou homologue à AB le segment 
AB’, et ainsi de suite. 


Le triangle 
Par définition, on appelle triangle ABC (si À, B et C 
sont trois points non alignés) la figure constituée des 
segments AB, BC, AC appelés côtés et des points simul- 
eme 4. dr 
tanément intérieurs aux angles convexes ABC, BCA, CAB 
(fig. 5). 


triangle acutangle 


3 
triangle rectangle 


triangle obtusangle 


Remarquons que tout triangle est une figure convexe, 
une figure convexe étant par définition une figure telle 
que, si deux points À et B lui appartiennent, alors le 
segment AB lui appartient. Il Y a trois cas bien connus 
d'égalité des triangles : 

— deux triangles ayant deux côtés égaux et l'angle 
compris entre ces côtés égal sont égaux; 

— deux triangles ayant un côté égal et les angles 
adjacents à ce côté égaux sont égaux; 

— deux triangles ayant leurs trois côtés égaux sont 
égaux. 

On démontre qu'un côté d'un triangle est plus petit que 
la somme des deux autres et plus grand que leur différence. 
Ce résultat est généralisé en topologie sous le nom d'iné- 
galité triangulaire (voir 7opologie) (fig. 6). 

On démontre que le postulat d'Euclide implique que la 
somme des angles d'un triangle plan est égale à un angle 
plat ou, de même, que tout angle externe d'un triangle est 
égal à la somme des angles internes non adjacents (fig. 7). 
Distances, lieux, symétries 

Par définition, la distance entre deux points est la 
longueur de leur segment; la distance d'un point à une 
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droite est la distance de ce point à sa projection sur la 
droite. On en déduit que la distance d’un point à une droite 
est le minimum des longueurs des segments ayant pour 
extrémités le point considéré et un point de la droite. On 
définit la distance de deux droites parallèles comme la 
distance d'un point de l'une à l'autre (fig. 8). 


Richard Colin 


On appelle /ieu des points qui jouissent d'une propriété 
donnée l'ensemble de tous les points pour lesquels cette 
propriété est vérifiée. On démontre facilement que le lieu 
des points équidistants des extrémités d’un segment est la 
perpendiculaire élevée en son centre qu'on appelle axe du 
segment. On démontre aussi que le lieu des points d’un 
plan à une distance donnée d d'une de ses droites m 
est la réunion de deux parallèles à la droite (fig. 9). 


AE 
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Ce) 
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= 
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Par définition, une circonférence (ou par extension, un 
cercle) est le lieu des points d’un plan à égale distance 
d'un point, appelé centre. Cette distance commune se 
nomme rayon, et le diamètre est le double du rayon 
(fig. 10 et 11). 

On démontre que deux cercles dont les rayons sont 
égaux sont égaux. 

Par définition, deux points sont dits symétriques par 
rapport à un point O si O est le milieu de leur segment; 
on les dit symétriques par rapport à une droite s (axe 
de symétrie) si celle-ci est l'axe de leur segment. La 
figure F” symétrique d’une figure F par rapport à O (res- 
pectivement par rapport à s) est lieu des points symétriques 
des points de F par rapport à O (respectivement par rap- 
port à s). 

On démontre le théorème suivant très important : deux 
figures symétriques sont isométriques. 


Grandeurs géométriques 

Considérons un ensemble (généralement infini) d'êtres 
entre lesquels on peut établir une relation d'équivalence. 
Sur les classes d'équivalence, on se donne une opération 
interne qu'on appelle somme et une relation d'ordre total 
compatible. Il est donc permis de parler de multiple d’une 
grandeur. En pratique, chaque « grandeur » est à son tour 
une classe de figures géométriques équivalentes : les 
segments, les angles, les polygones sont des classes 
de grandeurs homogènes en identifiant l’équivalence avec 
la congruence dans les deux premiers cas, avec l’équi- 
décomposabilité dans le troisième. On a l'habitude de 
parler de somme et de comparaison de figures géomé- 
triques, en sous-entendant de se référer aux grandeurs. 

Lorsqu'on se fixe un élément arbitraire V dans une classe 
de grandeurs homogènes, le rapport & d'une grandeur G 
de la classe par rapport à V s'appelle mesure de G par 
rapport à l'unité V; et si on a une correspondance biuni- 
voque entre # et G, on traduit toute relation d’équiva- 
lence, de somme par rapport à la mesure. Le choix de 
l'unité de mesure se fait en considération des besoins : 
l'unité de longueur est le mètre, celle de l'amplitude angu- 
laire est le degré ou le radian (fig. 12, 13, 14). 

Par définition, deux classes K et K’ de grandeurs res- 
pectivement homogènes, en correspondance biunivoque, 
sont dites proportionnelles si les rapports de deux gran- 
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A Figure 12 — polygones équivalents : 1) équivalence de deux polygones 
décomposables en un même nombre de triangles respectivement égaux; 

2) équivalence d'un triangle avec un parallélogramme ; 

3) équivalence d'un polygone régulier avec un triangle; 4) équivalence d'un trapèze 
avec un triangle; 5) équivalence de deux parallélogrammes; 6) équivalence d'un 
polygone avec un autre polygone ayant un côté en moins. 

Y Ci-dessous, figure 13—1) premier théorème d'Euclide : /e carré qui a comme 
côté un côté de l'angle droit d'un triangle rectangle est équivalent au rectangle 
dont les côtés sont l'hypoténuse et la projection de ce côté sur l'hypoténuse; 

2) théorème de Pythagore : /e carré construit sur l'hypoténuse d'un triangle 
rectangle est équivalent à la somme des carrés construits sur les côtés de l'angle 
droit; 3) deuxième théorème d’Euclide : /e carré construit sur la hauteur relative à 
l'hypoténuse d'un triangle rectangle est équivalent au rectangle qui a pour côtés 
les projections sur l'hypoténuse des deux côtés de l'angle droit. 

En bas, figure 14 : 1) /es deux théorèmes d'Euclide permettent la construction 

du carré équivalent à un rectangle donné; 2) le carré construit sur la somme 
(différence) de deux segments est équivalent à la somme des carrés construits sur 
chacun d'eux, augmentée (diminuée) du double du rectangle qui les a comme côtés. 


natale à 


j 


/ 


diamètre 


cercle 


secteur circulaire 


fig. 11 
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À Le mathématicien 

et philosophe grec, Thalès; 
on lui doit avant tout 
d'avoir rapporté d'Égypte 
en Grèce les fondements 

de la véritable géométrie. 


> Figure 15 : /es mesures 
de surfaces des principales 
figures géométriques. 


Y Figure16 —conséquences 
du théorème de Thalès : 
1) construction du 
quatrième segment 
proportionnel; 2) division 
d'un segment en parties 
proportionnelles à des 
segments donnés; 

3) division d'un segment 
intérieurement et 
extérieurement dans le 
rapport k, où k est un 
nombre réel. 
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parallélogramme : 
S = bh 


b’ 
e——+ 


——————— 


_{b+b') 
= 3 h 


trapèze: S$S losange : 


——5 + 
s) 


triangle : 
abc A 
— = Vp(p-a)(p-b)(p-c) 
(2 p est le périmètre du triangle) 


? 


polygone circonscrit à un cercle de rayonr 


S = pr 


(2p = périmètre) 


quadrilatère inscrit : 


S = v{p-a) (p-b} (p-c) (p-d) 
(2 p = périmètre) 


deurs À, B de K et des correspondants A’, B’ de K’ sont 
toujours égaux. 

L'égalité À : B — A’ : B’ s'appelle proportion et jouit 
des propriétés arithmétiques des proportions numériques. 

On démontre le. critère de proportionnalité suivant : 
une condition nécessaire et suffisante pour que deux 
classes K et K’ de grandeurs respectivement homogènes 
et en correspondance biunivoque soient proportionnelles 
est que : 

— l'équivalence de deux grandeurs de K implique 
toujours celle des correspondants de K’; 

— si, pour trois grandeurs À, B, C de K, on a : 
A = B + C, alors, pour les correspondants de K’, on a: 
A’ = B’+C’. 

En appliquant ce critère, on démontre que tous les 
arcs d'un cercle (ou tous les secteurs d'un cercle) et 
les angles correspondants au centre sont proportionnels. 

De ces résultats, on peut déduire les mesures des sur- 
faces des principales figures géométriques (fig. 15). 

Les grandeurs homogènes dont nous venons de parler 
sont dites du premier genre, quand on identifie l'équiva- 
lence avec la congruence (c'est le cas des segments et des 
angles), et du second genre quand on identifie l'équiva- 
lence avec l'équidécomposabilité. On appelle grandeurs 
du troisième genre celles pour lesquelles l'équivalence 
n'est identifiable ni avec la congruence, ni avec l'équi- 
décomposabilité. La méthode qui remonte à Eudoxe et 
qui fut utilisée systématiquement par Archimède pour 
traiter ces grandeurs est fondée sur le procédé d' «exhaus- 
tion » qui repose sur le postulat de la continuité. 

Ce procédé a été utilisé pour mesurer la longueur d'un 
arc de cercle (et du cercle) et la surface d'un cercle. Il 
a été ainsi établi que le rapport entre un cercle et son 
diamètre est le nombre 7, dont la transcendance a été 
démontrée par F. von Lindemann en 1882 : 

r = 3,141 592 653 589 793 238 462 643 383 279 50... 
(Archimède avait déjà réussi à démontrer que le nombre 7 
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polygone régulier 
S = pa 


Richard Colin 


0 1 ee 

7 et 3 + 5) On en déduit que 
la longueur d'un cercle de rayon r est égale à 2 xr. Le 
même procédé permet d'établir que la surface d'un 
cercle de rayon r est égale à rr?. 


2 , 1 
était compris entre 3 + 


La similitude 


Du critère de proportionnalité, on déduit le théorème 
de Thalès : Un faisceau de droites parallèles détermine sur 
deux droites sécantes deux classes de segments pro- 
portionnels. 

De ce théorème, on déduit que, si on se donne deux 
points À et B et un nombre réel &, il existe un seul point C 
intérieur au segment AB et, si &k£ 1, un seul point D 
sur son prolongement, tels que AC/BC = Kk, AD/BD = k 
(fig. 16). 

Il est usuel de dire que C et D divisent le segment AB 
intérieurement et extérieurement dans le rapport &; 
le quaterne ordonné ABCD est un groupe harmonique 
(voir Géométrie projective). 

Deux figures sont dites semblables s'il est possible de 
trouver une correspondance biunivoque entre leurs 
points telle que deux segments homologues soient tou- 
jours proportionnels avec le même rapport 4, appelé 
rapport de similitude (dans le cas particulier où ce rapport 
vaut 1, on a l'égalité). 

Dans l’ensemble des figures d'un plan, la similitude 
est une relation d'équivalence. 

Comme pour l'isométrie, on peut donner des défini- 
tions plus précises pour les polygones. Plus précisément : 
deux polygones sont semblables s’il existe entre leurs 
sommets une correspondance biunivoque telle que les 
angles homologues soient égaux et les côtés homologues 
proportionnels. 

Pour les triangles, on a trois critères particuliers de 
similitude. 


D. Ribas = 


La géométrie dans l’espace 


Les axiomes 

Tous les axiomes de la géométrie plane et leurs consé- 
quences sont valables en géométrie dans l'espace. Il 
existe des axiomes supplémentaires d'appartenance à 
l'espace tels que : « étant donné un plan, il existe au moins 
un point qui ne lui appartienne pas et par conséquent 
une infinité » (fig. 17, 18, 19, 20, 21). 

Tous les concepts de la géométrie plane tels que : 

— l'orthogonalité 

— le parallélisme 

— la distance 

— le lieu 

— la symétrie 
se généralisent en géométrie dans l'espace. Par exemple, 
on dit que : « deux plans sont parallèles s'ils n'ont 
pas de points communs » (fig. 21). 
Principales figures de l’espace 

Par définition, deux demi-plans ayant la même origine s 
déterminent deux régions, chacune d'elles s'appelant 
dièdre d'arête s et de faces x et 5. Les concepts d'égalité, 
d'amplitude, d'inégalité, de somme de dièdres s'établis- 
sent de la même manière que pour les angles (fig. 22). 

Considérons un polygone (plan) convexe à n côtés, 
un point V n'appartenant pas à son plan, et les n demi- 
droites ayant leur origine en V et passant chacune par 
un sommet du polygone; l'ordre des sommets du poly- 
gone induit un ordre pour les demi-droites, de sorte qu'on 
peut prendre en considération les angles dont les côtés 
sont les couples de demi-droites consécutives. La sur- 
face constituée par l'ensemble de ces angles divise 
l'espace en deux régions: celle qui ne contient pas les 
prolongements des demi-droites s'appelle angle solide 
convexe : V en est le sommet, les 7 demi-droites en sont 
les arêtes, tandis que les faces de l'angle solide sont les 
angles qui viennent d'être définis (f/g. 23). 


1.G.D.A. 
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À Le cube qui a comme 
arête l'unité de mesure 
linéaire est pris comme 
unité de mesure du volume 
d'un polyèdre. 


<« Figure 17 : demi-droiïte 
appartenant à un 
demi-espace déterminé 
par un plan. 

Figure 18 : par un point 
extérieur à deux droites 
non sécantes, passe 

une seule droite qui les 
intersecte toutes 

les deux. 

Figure 19 : théorème 

des trois perpendiculaires. 
Figure 20 : angle d'une 
droite avec un plan 
qu'elle intersecte. 


1.G.D.A. 


À Droites et plans 

(figure 21) : 1, angle 

de deux droites orientées; 
2, droites orthogonales; 
3, plan et droite parallèles ; 
4, plan passant par une 
droite parallèle à un plan; 
5, plan et droites 
perpendiculaires à 

une droite en 

des points distincts; 

6, unicité du plan passant 
par une droite et parallèle 
à une autre droite qui ne 
coupe pas la première; 

7, plans perpendiculaires 
à une droite 

en des points distincts; 

8, intersections parallèles 
d'un plan avec 

des plans parallèles ; 

9, plan parallèle à 

un autre, déterminé 

par 2 droites sécantes 
parallèles à 2 droïtes 

du plan donné; 

10, distance de 2 droites 
non sécantes. 


> Dièdres (figure 22). 
Plans perpendiculaires : 
1, section normale 

d'un dièdre; 

2, dièdre droit; 

3, section inclinée 

d'un dièdre; 

4,5, 6, plans 
perpendiculaires ; 

7, unicité du plan 
perpendiculaire à un plan 
donné passant par une 
droite non perpendiculaire 
à ce dernier. 


a 
NX 
ES 
b 
2 


7 
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On définit aussi les pol/yèdres qui sont des grandeurs 
du troisième genre, c'est-à-dire qu'il est possible de 
définir une relation d'équivalence dans l'ensemble des 
polyèdres, mais deux polyèdres équivalents ne sont géné- 
ralement pas décomposables en un nombre fini de 
parties égales : la comparaison entre pyramides demande 
déjà le procédé d' « exhaustion ». On appelle vo/ume 
l'abstraction relative à toute une classe de polyèdres 
équivalents. Comme unité de mesure du volume d'un 
polyèdre, on prend le cube qui a comme arête l'unité de 
mesure linéaire (fig. 24). 


La géométrie moderne 


En géométrie élémentaire, on a étudié des critères 
d'équivalence entre figures : on a parlé de figures égales, 
de figures équivalentes, de figures semblables. Dans la 
première partie du XIX® siècle, se développèrent d'autres 
types de géométrie (la plus importante étant la géométrie 
projective) : en résumé, elles établissaient de nouveaux 
critères d'équivalence entre figures. Le mathématicien 
F. Klein fut ainsi amené à exposer à l'université d'Erlangen 
un grand projet de classification des géométries, auquel 
fut précisément donné le nom de programme d'Erlangen. 
Il donna pour longtemps les idées de base des recherches 
en géométrie et montra la possibilité de construire de 
nouvelles géométries, qui furent ensuite étudiées avec 
succès. Plus récemment, le développement des recherches 
complique un peu le cadre général de la géométrie, mais 
le programme d'Erlangen reste toujours une œuvre des 
plus valables pour une vision plus claire et synthétique 
de la géométrie. 


La géométrie et la théorie des groupes 


Le programme d'Erlangen se réfère essentiellement aux 
espaces R?, C7 et Px (R) (voir Topologie), mais on peut 
l'appliquer à d'autres espaces. 

L'idée centrale de F. Klein est la suivante : tout type 
de géométrie est caractérisé par une relation d'équiva- 
lence à laquelle on peut associer un groupe G de bijec- 
tions de l’espace E sur lui-même (si E est un espace topo- 
logique, on parlera d'un groupe d'homéomorphismes 
[voir Topologie]). 

On vérifie facilement que dans l’ensemble P (E) des 
parties de E, la relation « A < B s’il existe une bijection 
du groupe G telle que B = f (A), (A, BE P (S)) » est 
une relation d'équivalence : 

si / est l'application identique telle que À (x) = x, 
on a / (X) = X, donc X = X; 


siY=f(X)etZ=g(Y),onaz=g(f(X)),etl'appli- 
cation composée de f et g étant encore biunivoque, de 
Xe Yet Y=2Zz,on tire X- Z. 

Un groupe G dans S donne donc la possibilité de parler 
de figures équivalentes respectivement à G, et d'établir 
la « géométrie du groupe G dans S ». Si G’ est un sous- 
groupe de G et si deux figures X et Ÿ sont équivalentes 
par rapport à G’, alors elles le sont par rapport à G. 

Dans la géométrie de G, cela a un sens de considérer 
une classe K d'objets si, par effet des correspondances 
de G, un objet de K se transforme en un objet de K : par 
exemple, on verra qu'en géométrie projective, on parle 
de l'ensemble des quadrangles (ou par abstraction, du 
concept de quadrangle : un quadrangle étant, par défini- 
tion, une figure formée par quatre points et les six droites 
qui les joignent) puisque, par effet d'une transformation 
projective, un quadrangle devient un autre quadrangle; 
mais on ne parle pas de parallélogramme puisqu'un 
parallélogramme peut se transformer en une autre figure. 
Tous les êtres qu’on peut considérer dans la géométrie de 
G peuvent aussi être considérés dans la géométrie de G’ 
si G  & G : les correspondants de G’ sont en fait des 
correspondants particuliers de G. Par exemple, la notion 
de « triangle rectangle » appartient à la géométrie des 
similitudes et par conséquent à la géométrie métrique 
euclidienne: inversement, la notion de périmètre est 
valable en géométrie métrique euclidienne, mais non en 
géométrie des similitudes (transformons par une simili- 
tude un polygone, on obtient un polygone de périmètre 
différent). 

En général, on dit qu’une géométrie est subordonnée 
à une autre si le groupe de la première est un sous-groupe 
de celui de la seconde : naturellement, l'espace doit être 


Palais de la Découverte, Paris 


surface latérale = nra : surface latérale = 27rh 
= 27r(r+h) 


surface totale nr(a+r) surface totale 
i V = nr°h 


_ ; Dh 
v-b+b+1bbih 


calotte sphérique : 


rface atérale = 


Richard Colin 


À À gauche, le 
mathématicien Félix Klein. 
A droite, figure 23; 

angles solides : 

1, angle solide convexe; 

2, trièdre trirectangle ; 

3, trièdre polaire; 

4, similitude des polygones 
obtenus en coupant 

un angle solide par des 
plans parallèles ; 

5, prisme convexe 

indéfini ou angle solide 
impropre; 

6, égalité des sections 
droites d'un même prisme. 


<« Figure 24 : on appelle 
volume /'abstraction 
relative à toute une classe 
de polyèdres équivalents. 


1.G.D.A. 


> Page ci-contre, en bas; 
figure 31 : 

un quaterne harmonique ; 
figure 31’ : 

un ordre circulaire; 
figure 32 : 

postulat d'ordre. 


>> Gravure extraite 
de la Géométrie de 
Giovanni Pomodoro (1624). 


le même, néanmoins il est encore possible de considérer 
une subordination dans le cas où l’espace où opère le 
premier est contenu dans celui du second (on verra 
plus tard la relation entre la géométrie affine et la géométrie 
projective). 

Soit F une figure; on appelle invariant de F dans la 
géométrie du groupe G (ou invariant par rapport à G) 
un nombre x (F), associé à F, qui a la même valeur pour 
toutes les figures transformées de F dans G, c'est-à-dire 
que x (F) — x (g (F)), pour tout g € G. On dit inverse- 
ment qu'une autre figure K (F) associée à F est covariante 
avec F (ou aussi qu'elle est invariante) lorsque 


g (K (F)) = K (g (F)) 


(sa transformée par g coïncide avec la figure associée 
à g (F). Par exemple, le périmètre d'un polygone est un 
de ses invariants par rapport au groupe des isométries ; 
le centre d’un cercle est une figure covariante avec le 
cercle lui-même par rapport au même groupe. 


La géométrie projective 


La table des matières du programme de F. Klein débute 
par la géométrie projective. Quelques-uns de ses aspects 
étaient connus depuis longtemps (on pourrait remonter 
aux géomètres grecs, comme Apo/lonios et Pappus, et 
plus récemment à Desargues et Pascal), mais elle fut 
systématiquement étudiée à partir du XIX® siècle (Poncelet, 
Chasles, Gergonne, von Staudt et les autres). 

D'un point de vue analytique, on peut introduire la 
géométrie projective à partir de l'espace projectif 
Pr (R) (voir Topologie) : les points y sont représentés 
par des (n + 1)-uplets de nombres réels, non tous nuls 
(appelés coordonnées projectives homogènes), avec la 
convention que les coordonnées (Xxo, X1, …, Xn) et 
(oXo, oX1, …, pXn), avec p 0, représentent le même 
point; pour simplifier le raisonnement, on remplacera 
progressivement » par 2 (ou 3). 

Comme ensembles particuliers de points de l'espace 
projectif, mentionnons les hyperplans, lieux des points 
dont les coordonnées satisfont à une équation du 1°" degré 
homogène : 


(1) 


où les u; sont des nombres réels non tous nuls. 

Les u; sont les coordonnées de l'hyperplan (1), et deux 
hyperplans dont les coordonnées sont proportionnelles 
coincident. 

La géométrie projective est la géométrie du groupe des 
homographies, c'est-à-dire de l'ensemble des applica- 
tions de Px (R) dans lui-même qui au point (x) associe 
le point (y:) tel que : 


Uo Xo + Uy X1 + … + Un Xn = 0 
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Yi = 8i0X0 - 
= 0:20) 
avec det |ax| £ O (voir A/gèbre linéaire). 
Signalons un important invariant projectif (c'est-à-dire 
une quantité invariante par homographie), le birapport 
(A, B, C, D) de quatre points À, B, C, D d'une droite 


@i1 X1 + … + din Xn 


; CA DA ; Ë 
qui vaut :—— :——. Ce birapport est aussi appelé rapport 
CB DB 


anharmonique et, dans le cas où il a pour valeur — 1, 
rapport harmonique. 

On peut remplacer en géométrie projective le corps des 
nombres réels par le corps des nombres complexes ou un 
corps quelconque. 

La géométrie projective peut aussi s'étudier par voie 
axiomatique, sans l'usage d'une méthode analytique. 

En géométrie projective, on considère un espace 
comprenant une infinité d'objets appelés points, droites, 
plans liés par trois groupes de postulats : 

— les postulats d'appartenance; 
— les postulats d'ordre; 
— les postulats de continuité. 

Observons avant d'énoncer ces postulats que, dans ce 
qui précède, les mots point et hyperplan peuvent être 
échangés. Cette remarque contient, en substance, le prin- 
cipe de dualité de Poncelet qu'on va appliquer en faisant 
correspondre à chaque proposition sa duale. 


Les postulats d'appartenance : 


[P1] Deux points distincts 
déterminent une droite uni- 
que qui les contient. 

[P2] Un point et une droite 
ne passant pas par ce point 
déterminent un plan qui les 
contient. 


[P1'] Deux plans distincts 
déterminent une droite qui 
leur appartient. 

[P2'] Un plan et une droite 
non contenue dans ce plan 
déterminent un point qui 
leur appartient. 


[P3] S’ un point appartient à une droïte et celle-ci à 


un plan, le point appartient 


au plan. 


Indiquons deux de leurs conséquences immédiates : 


1) Deux droites distinc- 
tes se coupant en un point 
forment un plan (appelé 
conjugué des deux droites). 

2) Trois points n'appar- 
tenant pas à une même 
droite déterminent un plan 
auquel ils appartiennent. 


1”) Deux droites apparte- 
nant à un plan se coupent 
en un point (appelé inter- 
section des deux droites). 

2’) Trois plans ne pas- 
sant pas par une même 
droite déterminent un point 
qui leur appartient. 


On remarque donc que deux droites coplanaires « se 
rencontrent » toujours, de même que deux plans. 
Observons en outre qu'on passe des propositions écrites 


à gauche à celles écrites à droite en changeant les mots 
« point » et « plan ». On dit que [P1], [P1’] sont duaux. 
Quand on a démontré un théorème en géométrie pro- 
jective, on a automatiquement prouvé son dual. Le pos- 
tulat [P3] qui coïncide avec son dual est dit autodual. 

Pour exclure des exemples d'espaces trop réduits, 
on ajoute l'axiome suivant : 


[P4] // existe au moins cinq points tels que quatre 
quelconques d'entre eux ne soient pas coplanaires. 

La géométrie projective considère six formes fon- 
damentales : 


1re espèce 
Ponctuelle : ensemble des 
points d'une droite. 


Faisceau : ensemble des 
plans passant par une droite 
(axe). 


Faisceau de droites : ensemble des droites d'un plan 
passant par un point (centre). 


2° espèce 
Système plan : ensemble 


des points et des droites 
d'un plan. 


Gerbe ensemble des 
droites et des plans passant 
par un point. 


3° espèce 
Espace : considéré comme ensemble de ses points et de 
ses plans. 


Mentionnons les applications fondamentales : 


La projection des points 
d'une droite r du point O 
(n'appartenant pas à r) est 
la bijection, entre r et le 
faisceau de centre O situé 
dans le plan Or, qui à tout 
point P de 7 associe la 
droite OP (fig. 25). 


La projection des points 
d'une droite r sur une 
droite s ne coupant pas 7 
est la bijection entre r et le 
faisceau d’'axe s qui au 
point P associe le plan sP 


La section d'un faisceau 
de plans avec un plan © 
(n'appartenant pas au fais- 
ceau) est l'application duale 
de la projection de 7 sur O 
(fig. 26). 


La section d'un faisceau 
de plans par une droite s 
non coplanaire avec l'axe du 
faisceau est l'application 
duale de la projection de 7 
sur s (fig. 28). 


(fig. 27). 


Dans le plan, on a un autre type de dualité, la dualité 
plane : dans toute proposition de la géométrie plane, on 
peut remplacer les mots point et droite. Si F est une figure 
plane de points et droites, on la projette du point exté- 
rieur O (on obtient ainsi une figure de droites et plans), 
et ensuite on applique la dualité spatiale : on obtient une 
figure de droites et points. 

Par exemple, dans le plan, on a l'opération duale par 
dualité plane de la projection de r de O : la section d'un 
faisceau avec une droite. 


Le théorème des triangles homologiques est fondamen- 
tal : si, dans un même plan ou dans l'espace, deux triangles 
ABC et A’B’C’ sont tels que les droites joignant respec- 
tivement les trois couples de sommets homologues AA’, 
BB’, CC’ se rencontrent en un même point S, les trois 
points de concours des couples de droites portant les 
côtés homologues des deux triangles sont alignés, et 
réciproquement (fig. 29). 

On a aussi un théorème des quadrangles homologi- 
ques (fig. 30). 

Les points (A, B, C, D) d'une droite forment un qua- 
terne harmonique s'il existe un quadrangle plan MNPQ 
de telle sorte que A soit l'intersection de MN et PO, 
B celle de MP et NO, et que C soit situé sur MO et D 
sur NP : le théorème du quadrangle affirme que, les 
points À, B, C étant donnés, le point D est univoquement 
déterminé, indépendamment du choix du quadrangle 
MNPO (fig. 31). 


1.G.D.A. 


1.G.D.A 
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<« Figures 25, 26, 27, 28 : 
voir explications 
dans le texte. 


<« Figure 30 : théorème des 
quadrangles homologiques. 


Y Figure 29 : théorème des 
triangles homologiques. 
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1.G.D.A. 


À Figure 33 : 
voir explications 
dans le texte. 


1.G.D.A. 


A Figure 34 : voir 
explications dans le texte. 


Figure 35: 
projectivité entre deux 
ponctuelles (% et ®’}. 


1.G.D.A. 


Les axiomes jusqu'ici introduits sont satisfaits aussi 
par des modèles ayant un nombre fini de points. Pour avoir 
une géométrie plus proche de l'intuition, on a besoin d'en 
ajouter d'autres. 

Éclaircissons avant tout ce qu'on entend par ordre 
circulaire : on essaye en substance de caractériser la 
manière avec laquelle on suit les points d'un cercle par- 
couru dans un certain sens. Si on lui enlève un point P, 
il devient un segment. On peut ainsi dire qu'un ordre 
circulaire Q dans un ensemble | est une famille Q, 
d'ordres totaux (un pour chaque PE€l) dans | — {P}, 
de telle manière que si dans Q, Q < R <S, alors dans 
QGiRE S< P (Mg. 31”). 

Nous appellerons /nverse de (Q (et on désigne par Q’) 
l'ordre circulaire formé des ordres inverses des Q;. 


Donnons alors un nouveau postulat (d'ordre) : 

[P5] Sur une forme de première espèce, il existe 
deux ordres circulaires, inverses l'un de l'autre, tels que, 
deux éléments À, B étant donnés, il existe au moins un 
élément C qui précède B dans Q1 (fig. 32). 

Il s'ensuit qu'il existe aussi un élément D qui précède À 
dans (3 ; que Q 4 n’admet ni de minimum, ni de maximum, 
et que toute forme de première espèce (et aussi toute 
forme de 2° et de 3° espèce) a des éléments infinis. 

Étant donné deux éléments A, B et l'ordre Q1, l'en- 
semble des éléments qui dans Q 1 précède B s'appelle un 
segment d'extrémités À, B. Si on considère aussi l'ordre Q, 
on a deux segments d’extrémités À, B (ils sont dessinés 
avec des couleurs différentes sur la figure 33). 


On admettra alors l’axiome (d'invariance des ordres) : 

[P6] L'image d'un segment par une projection et une 
section est un segment (c'est-à-dire que les ordres se 
conservent par projections et sections). 

Étant donné deux couples [A, B], [C, D] d'éléments 
distincts d'une forme de première espèce, il peut arriver 
que C, D (fig. 34) soient situés sur le même segment 
d'extrémités À, B (dans un tel cas, A et B aussi sont situés 
sur le même segment CD) [fig. 32]. Dans ce cas, on dit 
que les couples [A, B], [C, D] ne sont pas séparés, et 
dans le cas contraire qu'ils sont séparés (ce qui arrive, 
par exemple, lorsque À, B, C, D sont des éléments d'un 
quaterne harmonique). 


Donnons enfin l’axiome de la continuité sous la forme 
de Dedekind : 

[P7] Étant donné une partition d'un segment d'une 
forme de première espèce en deux classes, telles que 
(dans un des ordres de la forme) tout élément de la 
première classe précède tout élément de la seconde, 
alors il existe un élément maximal dans la première classe 
ou un élément minimal dans la seconde. 

Une projectivité entre des formes de 1° espèce est 
une bijection qui s'obtient en appliquant successive- 
ment un nombre fini de projections et de sections. Une 
projectivité entre deux formes de 2° espèce, deux sys- 
tèmes plans, par exemple, fait correspondre à un point 
d'un des plans un point ou une droite de l'autre, ou aux 
points d'une droite du premier les points d'une droite ou 
les droites d'un faisceau de l'autre. 

Dans le premier cas, la projectivité est une homogra- 
phie ou collinéation, dans le second une réciprocité ou 
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corrélation. Deux formes de 3° espèce sont projectives 
lorsque à un point de l’une correspond un point ou un 
plan de l'autre et qu'aux points d'une ponctuelle corres- 
pondent les points d'une ponctuelle ou les plans d'un 
faisceau. Dans le premier cas, on a une homographie, 
dans le second une réciprocité. 

Les projectivités d'une forme assignée dans elle-même 
forment un groupe. 

Sur une forme ® d'espèce k (k = 1, 2, 3), déterminons 
k — 2 éléments distincts A; (pour k — 2, 3, supposons 
que 3 d'entre eux n'appartiennent pas à une forme de 
1r= espèce) ; sur une autre forme ®’ de la même espèce, 
déterminons # — 2 éléments A;, avec les mêmes condi- 
tions. Il existe une et une seule projectivité entre les deux 
formes qui à A; associe A;’. Dans l'exemple de la figure 
35, on a reporté la construction d'une telle projecti- 
vité dans le cas où ® et ®’ sont des ponctuelles (la 
séquence d'opérations, à partir de ®, est la suivante : 
projections de S, section avec t, projections de S’, sec- 
tions avec ®’). La construction est une preuve directe 
de l'existence d'une telle projectivité. 


La géométrie projective peut aussi se construire à partir 
de la géométrie euclidienne (ou plus précisément affine). 
Considérons les directions de l'espace ordinaire (c'est-à- 
dire les ensembles de droites deux à deux parallèles), 
et appelons-les points impropres, tandis que les points 
de l’espace sont appelés points propres. 

On appelle ensuite droite impropre l'ensemble des 
points impropres d'un plan, et p/an impropre l'ensemble 
de tous les points impropres. On constate facilement que 
les axiomes de la géométrie projective sont vérifiés. 
Toute droite propre acquiert un point ultérieur, son point 
impropre, qu'on « rejoint » en parcourant la droite dans 
l'un ou l’autre de ses sens; la droite devient une courbe 
fermée, comme un faisceau de droites. 


La géométrie affine et ses subordonnées 


La géométrie affine, tout en n'ayant pas eu l'im- 
portance historique de la géométrie projective, est assez 
importante par de nombreux aspects. Pour donner une 
idée générale, on peut dire qu'en géométrie affine, outre 
toutes les notions d'appartenance, on garde celle de 
parallélisme, mais non celle de perpendiculaire, dis- 
tance, etc. 

D'un point de vue analytique, l'espace affine est 
l'espace R?, c'est-à-dire l'ensemble des n-uplets de 
nombres réels, muni du groupe des affinités, qui au point x 
fait correspondre le point y tel que : 

Vi = &i1 X1 + @i9 X9 + … + din Xn + bi, 
avec det |ax| # 0. 

En géométrie affine, deux parallélogrammes quel- 
conques sont équivalents, tandis que ne le sont pas un 
parallélogramme et un quadrilatère qui n'est pas un parallé- 
logramme. Parmi les coniques, deux ellipses sont équi- 
valentes, de même que deux hyperboles et deux para- 
boles ; mais une ellipse et une hyperbole ne sont pas équi- 
valentes. On ne parle pas de rectangle, de losange, de 
cercle, puisque dans la définition de telles figures inter- 
viennent des concepts étrangers à la géométrie affine. 

On peut aussi parler de géométrie affine sur un corps, 
en considérant comme espace l'ensemble des n-uplets 
ordonnés d'éléments du corps. On peut aussi passer de la 
géométrie affine à la géométrie projective. Dans l'espace 
affine, introduisons les points impropres, on obtient un 
espace projectif. Réciproquement, étant donné un espace 
projectif, on fixe un de ses hyperplans « comme hyperplan 
impropre : appelons parallèles les hyperplans qui se 
coupent en « et appelons affinités les homographies 
qui conservent « : on a alors un espace affine. 

La géométrie affine peut aussi se définir par voie axio- 
matique; il suffit de modifier à bon escient quelques 
axiomes de la géométrie projective (en particulier, au 
lieu de [P5], on postulera l'existence sur une droite de 
deux ordres totaux, l’un inverse de l'autre). 

On peut définir, à partir d'un espace affine, un espace 
vectoriel de la manière suivante. Considérons les couples 
ordonnés de points (fig. 36), et établissons entre eux 
la relation d'équivalence suivante féquipollence) : si A, B, 
X, Y sont des points de coordonnées &:, bi, xi, yi (i variant 
de 1 àn), on pose: 


U=1,2..n) 


(A, B) = (X, Y) si bi — à; = y; — x; quel que soit j. 


Les classes d'équivalence s'appellent les vecteurs libres 
de l'espace. Les différences indiquées s'appellent provi- 
soirement composantes du vecteur libre. Soit deux vecteurs 
u, v de composantes (uw), (v:) et un nombre réel & (si 
l'espace est défini sur un autre corps, un élément du 
corps); on définit le vecteur u — v comme le vecteur 
de composantes (u; + vw) et le vecteur ku comme le 
vecteur de composantes (ku:). De cette manière, l'en- 
semble des vecteurs libres est muni d'une structure 
d'espace vectoriel sur R (ou plus généralement, sur le 
corps sur lequel est défini l'espace affine). Les (ui) 
sont les composantes du vecteur u par rapport à la base 
formée des vecteurs de composantes (fig. 37) : 


0.20) (01:20). 22,100 270; 1); 


Pour d’autres applications, il peut être utile de considérer 
dans l’ensemble des couples de points d'autres relations 
d'équivalence : par exemple, celle qui associe des couples 
ordonnés équipollents et appartenant à la même droite. 

Parmi les affinités d’un espace sur lui-même, notons en 
particulier : 

— les translations qui forment un groupe, qu'on peut 
identifier au groupe additif des vecteurs libres; 

— Ja symétrie par rapport à un point A. Les symétries 
ne forment pas un groupe, mais l'ensemble des transla- 
tions et des symétries forme un groupe; 

— les homothéties : on les obtient en « dilatant » 
où en « contractant » l'espace par rapport à un de ses 
points appelé centre. Si les coordonnées du centre 
sont &;, les homothéties sont données par : 


Yi= px +b;: (p£O et pi) 


avec b; = a; (1 — p). Les homothéties de centre donné 
(application identique comprise) forment un groupe, 
ainsi que toutes les homothéties et les translations de 
l'espace. 


On a des géométries subordonnées à la géométrie 
affine : la géométrie des similitudes fondée sur le 
groupe des similitudes qui est un sous-groupe de celui 
des affinités, et la géométrie métrique euclidienne 
subordonnée à la géométrie semblable puisque son groupe 
de transformation, qui est celui des isométries, est un 
sous-groupe de celui des similitudes. 

Fixons dans l’espace affine à 7 dimensions un n-uplets 
ei de vecteurs linéairement indépendants, c'est-à-dire une 
base de l'espace vectoriel associé (voir A/gèbre linéaire) ; 
si on se fixe une origine O, on a un système de référence : 
à tout point P, on associe comme coordonnées les compo- 
santes du vecteur d'extrémités O, P. Toute autre base e”; 

n 

Y ä&ix ex avec: 
k=1 


n n 
(1) E ax —1 Xaxax = 0Opourk£ k’ 
i=1 i=1 
sera dite orthonormale. Les similitudes sont les bijections 
de R? dans lui-même représentées par : 


qui s'obtient ainsi à partir de e:; : ei — 


n 
Yi= 9 D GExE + bi, 
k=1 

où les ax satisfont à (1), et # est un nombre réel positif. 
Pour n = 1, on retrouve toutes les affinités de R; pour 
n = 2, on a les correspondances qui à (x1, x2) associent 
(y1, Y2) : 

o (x1 cos x + X2 sin &) + bi 
ya = 9 (x1 sin & + x2 cos x) — bo; 
les similitudes correspondant aux signes supérieurs 
sont dites directes, les autres inverses. Toutes les simi- 
litudes, ainsi que les seules similitudes directes, forment 
un groupe. 

Les isométries sont les similitudes pour lesquelles on 
a : pe — 1. Les isométries forment un groupe, ainsi que les 
Isométries directes : elles transforment une base ortho- 
normale en une base orthonormale. 

Un couple de droites distinctes non parallèles admet 
un invariant par rapport au groupe des similitudes : leur 
angle: un couple de points distincts n'en admet pas. Par 
contre, un tel couple admet un invariant par rapport au 
groupe des isométries : leur distance. Pour le traité axio- 
matique de la géométrie euclidienne, voir la Géométrie 
élémentaire. 


M. Varin-Pitch 


Apercu sur les géométries non euclidiennes 


On appelle géométrie non euclidienne une géomé- 
trie de caractère métrique dans laquelle le postulat des 
parallèles ou postulat d'Euclide est remplacé par un 
axiome non équivalent. Ces géométries sont de deux 
types. 

— La géométrie hyperbolique, dans laquelle on 
admet que, dans un plan donné, par un point extérieur 
à une droite, on peut mener une infinité de parallèles. 
Cette géométrie fut introduite par NV. Lobatchevski au 
début du XIX® siècle. 

— La géométrie elliptique, dans laquelle deux droites 
coplanaires se coupent toujours. Pour pouvoir admettre 
un tel postulat, il est ainsi nécessaire de laisser tomber 
aussi l’axiome d’Archimède. Cette géométrie est due à 
B. Riemann. 

De telles géométries peuvent se traiter de diverses 
façons. Ici, nous n'en montrerons qu'une pour la géomé- 
trie hyperbolique. 

Dans le plan projectif réel, considérons une conique (e 
de points réels et non dégénérée. On a un modèle de géo- 
métrie hyperbolique plane en prenant comme « points » 
les points intérieurs à C et comme « droites » les segments 
de droites intérieurs à C. Il est immédiat de constater que, 
étant donné une « droite » 7 et un « point » P qui lui est 
extérieur, toutes les « droites » passant par P contenues 
dans un certain angle fermé n'intersectent pas 7. Comme 
« distance » entre À et B, on peut prendre le nombre 
klg (A, B, K1, K2), où k est une constante à fixer une fois 
pour toutes, et K1, K2 les intersections de la droite AB 
avec C (pour la notion de birapport, voir la Géométrie 
projective). Le groupe fondamental est celui des homo- 
graphies qui transforment la conique © en elle-même 
(celles-ci conservent la distance définie plus haut) [voir 
fig. 38]. 
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y Figure 36; équipollence : 
les couples de points 
joints par les flèches 

de même couleur sont 
équipollents. 

Figure 37 ; règle pratique 
pour additionner deux 
vecteurs du plan. 


1.G.D.A. 


A Figure 38 : modèle de 
géométrie hyperbolique 
plane obtenu 

en prenant comme 

« points » et « droites » 
les points et les segments 
de droites intérieurs 

à la conique. 


1.G.D.A. 


À Figure 1 : le cercle 
trigonométrique. 


TRIGONOMÉTRIE 


Le mot « trigonométrie » signifie étymologiquement 
« mesure des triangles ». En fait, l'objet de cette science 
est de faire le lien entre des grandeurs linéaires (longueurs, 
surfaces) et des grandeurs angulaires, par l'intermédiaire 
des fonctions circulaires. Elle doit son origine à des pro- 
blèmes d’arpentage et d'astronomie. 

On distingue la trigonométrie plane, qui ne traite en 
général que des figures planes, et la trigonométrie sphé- 
rigue, plus compliquée, dont l'objet est l'évaluation des 
éléments de certaines figures de l'espace. 

Les études théoriques commencées par les Babyloniens 
et les Grecs (Hipparque, Ptolémée), furent poursuivies 
d'abord par les Arabes, et ensuite en Europe par Regio- 
montanus, Copernic, Viète. Neper, avec la découverte des 
logarithmes (1614), donna à la trigonométrie de nou- 
velles possibilités, et de nouveaux développements furent 
trouvés par les mathématiciens des XVII® et XVIIIE siècles : 
Legendre, Cauchy, J. Bernoulli, Newton, Leibniz, 
Delambre ; et le grand mérite d'avoir porté la théorie à sa 
version définitive appartient à Euler (1707-1783). 


Théorie des fonctions trigonométriques 


Étant donné un plan, choisissons un point quelconque O 
du plan comme origine et un segment u comme unité de 
mesure de longueur; on choisit un système d'axes carté- 


> — 
siens orthogonaux Ox et Oy d'origine O (voir Géométrie 
analytique) avec des sens positifs tels que l'on passe de 
— —> 


Ox à Oy par une rotation contraire au sens des aiguilles 
d'une montre, appelée sens trigonométrique (fig. 1). 
Tout point du plan, et de là, tout point P d'un cercle 
de centre O et de rayon vw, peut être repéré à l'aide de deux 
nombres qui s’obtiennent en mesurant avec u les deux 


— —+ 
segments x et y, projections de P sur les axes Ox et Oy, 
et s'écrira : P — P (x, y). Les angles ont comme origine 

— 


le demi-axe positif Ox et comme sens positif le sens trigo- 
nométrique. 

Comme unité de mesure angulaire, on utilise le degré : 
1° — 1/360 de l'angle égal à un tour complet, avec ses 
deux sous-multiples, la minute (1’) et la seconde (1”) 
(60° — 1°, 60” — 1’); le radian : 1 rd — angle qui 
représente sur le cercle un arc de longueur égale au rayon 
du cercle; le degré est utilisé dans les applications pra- 
tiques, le radian dans les études théoriques. 

La partie du plan limitée par le cercle de centre O et 
de rayon 7 = u se nomme cercle trigonométrique. 

Puisqu'on utilise fréquemment les deux unités angu- 
laires, il est important de voir rapidement la relation qui 
les lie et les valeurs qu'ont les angles les plus importants 
mesurés avec ces unités. Pour avoir la mesure en radians 
d'un angjle, il suffit de diviser un arc qu'il sous-tend par le 
rayon du cercle auquel appartient cet arc. Étant donné 
que la longueur d’un cercle de rayonrestc = 27r,ona 
immédiatement : 

un angle égal à un tour complet = 360° = 2 x rd. 

Pour passer d'un système de mesure à l’autre, on utilise 
alors simplement la proportion : 


a°/x rd — 360°/2 = 
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Les fonctions trigonométriques 
circulaires directes 

On distingue /es fonctions circulaires directes qui mesu- 
rent un segment en fonction d'un angle et /es fonctions 
circulaires inverses qui mesurent un angle en fonction 
d'un segment. Sauf mention contraire, on mesurera dans 
cette partie les angles en radians. 

Considérons (fig. 2) un cercle trigonométrique et dési- 
gnons par « un angle orienté dont le premier côté coïncide 


_ = :. PE . + LVTA 
avec le demi-axe Ox; soit M l'intersection de l'autre côté 


de l'angle avec le cercle. Les fonctions qu'on va définir 
mettent en relation l'angle qui définit M avec trois seg- 


ä se e = 
ments. Désignons par A l'intersection du cercle avec Ox, 


: 3 — 7 
par M1 et M2 les projections de M sur les axes Ox et Oy, 
et par T l'intersection de la tangente en A au cercle et de 
l'autre côté de l'angle; on pose : 


Ge 


fig. 2 


Richard Colin 


See MM Bed SU t aux PT 
OA RC  : : 
c'est-à-dire qu'on définit : 

le sinus d'un angle « (ou d'un arc de cercle AM) 
comme le nombre positif ou négatif qui mesure le seg- 
ment M1M par rapport au rayon; 


le cosinus d'un angle « (ou d'un arc AN) comme le 
nombre positif ou négatif qui mesure le segment OM: 
par rapport au rayon; 


la tangente d'un angle « (ou d'un arc AM) comme 
le nombre positif ou négatif qui mesure le segment AT 
par rapport au rayon. 

Étant donné que les segments qui interviennent dans les 
définitions des fonctions trigonométriques sont parallèles 
à un des deux axes cartésiens, on peut leur attribuer un 
signe. 

Comportement et graphes de ces fonctions : on peut 
tracer les graphes des trois fonctions sin x, cos x et tg x. 
Sin x et cos x sont des fonctions définies sur R et pério- 
diques de période 2 7, c'est-à-dire que : 


sin (x+27)=sinx et cos (x + 27) = cos x; 


la tangente définie pour xÆ (2Kk + 3 (k entier), est 
périodique de période x : 
tg (X +7) = tg x. 

Il est donc suffisant de les représenter sur un intervalle 
de longueur égale à leur période. Faisons décrire à M un 
tour complet du cercle trigonométrique à partir de À, on 
obtient alors les différentes valeurs des fonctions pour 
construire les trois graphes. Ces fonctions sont continû- 


ment dérivables (voir Analyse), ce qui facilite l'étude de 
leurs sens de variation (fig. 3, 4,5): 


(sin x)’ = cos x 

(cos x)’ = — sin x 

tg x)’ 1 

(tg x) cos? x 


On utilise aussi une quatrième fonction trigonométri- 
que : la cotangente, définie ainsi : 


tg? x 


cotg x — tg G—+): 


Dagli Orti 


définie pour tout x £ kr (KE N), elle est périodique de 
période 7 comme la tangente, et sa dérivée est égale à: 

1 
sin?x 
En examinant le cercle trigonométrique, on peut trou- 


ver une relation qui ramène à deux le nombre des fonc- 
tions circulaires directes indépendantes; en effet : 


(cotg x)’ — — — (1 + cotg? x) 


(si on regarde la figure tournée de 90°), ce qui entraîne 
que : 
cos « = sin (= — a). 
G—« 
Les coordonnées d'un point M d'une circonférence de 


rayon unité sont donc le cosinus et le sinus de l'angle qui . 


sous-tend l'arc AM. 
Les deux triangles OMM: et OTA étant semblables, on 


a : 
MM — TX ce qui entraîne que : tg x = ne 
OM: Où 9 Di hs 


En appliquant le théorème de Pythagore au triangle 
OMM:, on obtient : 
sin? &« + cos? & — 1; 
et en divisant les deux membres par cos? « : 
1 
1+tgax = —— 
ne cos? x 


Ce sont les trois relations fondamentales auxquelles on 
a souvent recours dans la théorie et les applications. On 
déduit facilement de ces relations : 


cos x 


- et 1 + cotg? « — 
sin & 


cotg x — 


sin? &° 


Réduction au premier quadrant 


On appelle réduction au 1°" quadrant l'opération qui 
consiste à ramener toute fonction trigonométrique d'un 
angle quelconque à une fonction trigonométrique d’un 


angle < = En tenant compte de la propriété de périodicité 


Tableau des valeurs des fonctions trigonométriques 
pour quelques angles remarquables 


<« Le philosophe et mathématicien Pythagore (VIe siècle av. J.-C.). 


Y Figure 3 : graphe des fonctions sin x et cos x. 
Figure 4 : graphe de la fonction tg x. 
Figure 5 : graphe de la fonction cotg x. 


Richard Colin 


1.G.D.A. 
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> Tableau des 
principales fonctions 
trigonométriques. 


» Figure 6: 
représentation graphique 
des formules d’addition. 


1.G.D.A. 


de ces fonctions, on peut toujours ajouter où retrancher 
à leur argument un angle d'amplitude 2 kr (ke N), 
et ainsi se ramener à un angle positif < 2 7. On peut, d'autre 
part, toujours décomposer un angle quelconque & com- 
pris entre 0 et 2 7 en somme d'un angle x compris entre 


(e) ts et d'un angle égal à - +). mais quand 


5 (ou r ou 


er 


l'angle de départ est compris entre O et — 5 


, On peut évi- 


ter de passer à un angle positif; la réduction au premier 
quadrant s'effectue par l'intermédiaire du tableau suivant 
dont on vérifie facilement les résultats sur le cercle trigo- 
nométrique : 


Formules d'addition et de soustraction 


Calculons les fonctions circulaires des angles somme 
ou différence de deux angles « et 8. Considérons le cercle 
trigonométrique et deux angles adjacents « et 8 d'ori- 


gine OA; soit AP et PO les arcs correspondant à ces deux 
angles, N l'intersection de la perpendiculaire abaissée de 
Q sur OA, H l'intersection de la perpendiculaire abaissée de 
Q sur OP, M l'intersection avec ON de la parallèle à OA 
passant par H, et K l'intersection de la perpendiculaire 
abaissée de H sur OA (fig. 6). 


if 


fig. 6 


- NO KH , MO 
(1) sin Mess va 
OH . HO 
SONT ER on SE 
= sin « cos 8 + cos «sin £; 
ON OK NK 
(2) cos (a+ BD) = RDA DA 
OH HO . 
= GAS Ga SN 


= cos x cos 8 — sin sin B£. 
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Ces deux formules constituent les formules d’addi- 
tion. En remplaçant 8 par — 8, on obtient les formules 
de soustraction : 


(3) 
(4) 


En posant 8 = «, on obtient: 


sin (œ — 8) = sin & cos 8 — cos « sin 8 
cos (x — 8) = cos x cos 8 + sin « sin B. 


(5) sin 2 x — 2 sin x cos «; 
(6) cos 2 « — cos? « — sin? « — 2 cos? x — 1 
= 1 — 2 sin? «. 


: ' sin 
En tenant compte de l'égalité tg x — É 
cos & 


et des formu- 


les précédentes d'addition et de soustraction, on obtient : 


(7) 5 (+) = RSS 
(8) 19 (— 9) = PRE 
(9) gaie 


Dans de nombreux problèmes, on utilise les formules 
suivantes qui expriment sin & et cos « en fonction de la 


es œ ee ë 
tangente de l'arc moitié : tg 3: On les obtient à partir des 


formules (5) et (6) en remplaçant « par > et enfin en 


: à £ £ : x 
divisant numérateur et dénominateur par cos? 5 : 


& - 142% 
| 2 tg 5 1 tg 5 
sin &« — 3 cos & = a 
a 2 1 +t DRE 
1 + tg 5 gs 
en divisant membre à membre, on obtient : 
œ 
: 2 95 
L = ——— 
œ 
__ tg2 = 
1 tg 5 


Formules de transformation 


On appelle ainsi les quatre formules qui transforment une 
somme ou une différence de sinus ou cosinus en un pro- 
duit; on les obtient en additionnant et soustrayant entre 
elles les formules (1) et (3), et ensuite les formules (2) 
et (4). On obtient ainsi /es formules de Werner : 


Posons x + 8—peta—8 = q,c'est-à-dire « — es 


et 8 — Fe 2), on obtient alors /es formules de trans- 


formation : 


Fonctions trigonométriques circulaires 
inverses (ou réciproques) 


A toute valeur de la variable x, il correspond une valeur 
unique d’une fonction circulaire directe, mais la réciproque 
n'est pas vraie. En effet, considérons l'équation sin x = a 
où a est un nombre réel donné; il y a une infinité de valeurs 
de x qui satisfont à cette équation si a est un nombre 
compris entre — 1 et + 1; sauf si a = + 1, il y a deux 
angles compris entre 0° et 360° qui satisfont l'équation. 
Considérons, par exemple, l'équation 


xs 
=> 


| 3 : 
prenons le point (o. = et menons par ce point la paral- 
lèle à l'axe des x (fig. 7), on a deux intersections avec le 
cercle trigonométrique pour lesquelles l'équation est 
satisfaite : 


AOP = = 
es 73 
nn, 27 
= pres 
X—= AO 3 


Il est pratique d'exprimer toutes les solutions d'une 
équation de ce type par une formule unique : 


sinx=a = x=(—1)Ëa+kr 
cosx=a > x==a+2kr 
tgx—=a = x=a+kr 
où x est le plus petit angle positif satisfaisant l'équation 
proposée, et k un entier relatif. 

Lorsque les fonctions circulaires directes ont été intro- 
duites en analyse mathématique, il a été nécessaire. de 
définir aussi leurs fonctions réciproques. Or, on a vu 
que ces fonctions ne sont pas monotones; on ne pourra 
donc définir des fonctions réciproques que si on se res- 
treint à des intervalles sur lesquels ces fonctions sont stric- 
tement monotones (voir Analyse). 

On définit ainsi les fonctions Arc sinus, Arc cosinus 
et Arc tangente comme fonctions réciproques de la res- 


FR 


triction du sinus à [5 — 5l de la restriction du cosi- 


nus à [0, x], et enfin de la restriction de la tangente à 
— 2,2 T| respectivement. 
| 2 | F 

Ainsi, Arc sin est une bijection strictement croissante 


|: et par définition (fg. 8) : 


y = Arcsinx  x=—siny 


de [— 1, + 1] sur [5 


ri T 


ALXRLT =2<ye + 


Arc cos est une bijection strictement décroissante de 
[— 1, + 1] sur [0, x] (fig. 9) : 
y = ATCCOSX <> X — COS y 
—1<x<+i 0O<y<7rT 


Arc tg est une bijection strictement croissante de R 


sur | +3] (fig. 10) : 
y = Arctgx Xx—=tgy 


Le théorème des fonctions réciproques (voir Analyse) 
permet de calculer les dérivées de ces fonctions, on a : 


(Arc sin x)’ = pour xe] —1, +1 


N1 — x? 
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A Figure 8 : fonction 
Arc sinus. 

Figure 9 : fonction 
Arc cosinus. 

Figure 10 : fonction 
Arc tangente. 


AT 


Y Figure 7 : AOP = 


Cl 4 


ES eS 27 
et AOP'= 3 sont les 
deux angles compris 


entre 0° et 360° qui 

satisfont l'équation 

si _V3 
inx= 


fig. 7 p 


Richard Colin 


1.G.D.A. 


À Figure 11 : théorème 
des projections. 


» Le mathématicien 
suisse Leonhard Euler 
(1707-1783). 


(Arc cos x)’ — pourxe]—1,+1! 


1 — x2 


Arc tg x) = —. 
(Arctgx) = 3 

Ces fonctions sont très utilisées en calcul intégral et 
permettent d'écrire le nombre + comme intégrale dé- 
se TÆ rl dx 
finie ; par exemple : = — | 


Trigonométrie plane 


La trigonométrie plane étudie les relations métriques 
entre les éléments de figures planes délimitées par des 
segments de droite. De telles figures étant toujours 
décomposables en triangles, la résolution des triangles est 
particulièrement importante. Dans ce paragraphe et dans 
le suivant, les angles seront mesurés en degrés. 

Résoudre un triangle signifie : étant donné quelques 
éléments suffisant à le déterminer univoquement, calculer 
les autres. Un angle est généralement déterminé quand on 
connaît une de ses fonctions trigonométriques, car on 
sait qu'il est toujours < 180°, et dans le cas où on hésite 
entre un angle aigu et un angle obtus, on peut toujours 
recourir au calcul d’une seconde fonction du même angle. 

Nous savons par la géométrie élémentaire qu'un triangle 
est déterminé quand trois de ses éléments, dont au moins 
un côté, sont donnés (un côté peut être remplacé par 
la surface). 


Théorème des sinus 


Quand trois éléments d'un triangle sont donnés, la 
solution s'obtient alors par la résolution d'un système de 
trois équations à trois inconnues. Comme première équa- 
tion, on a celle de la géométrie élémentaire : 

xa+B+y—= 1800 
les deux autres sont données par le théorème des sinus 
qu'on admettra : 

Dans un triangle quelconque, le rapport entre un côté 
et le sinus de l'angle opposé est constant et égal au dia- 
mètre du cercle circonscrit : 

a b C 


Théorème des projections 


Tout côté d'un triangle est égal à la somme des produits 
de chacun des autres côtés par les cosinus des angles 
qu'ils forment avec le premier. Abaissons du sommet A 
d'un triangle la perpendiculaire sur le côté BC (fig. 11), 
on obtient deux triangles rectangles : si 8 et y sont aigus, 
la base a est égale à la somme suivante : 

a = bcos y + ccos 8 
On peut vérifier que si y (par exemple) est obtus, cos y 
est négatif et la formule est toujours valable. 


Théorème du cosinus ou de Carnot 


Dans un triangle quelconque, le carré d'un des côtés 
est égal à la somme des carrés des autres diminuée du 
double produit de ces deux côtés par le cosinus de l'angle 
compris entre eux : 

a = b?+ c—2bccosx 

Pour démontrer ce théorème, il suffit d'écrire les trois 
relations du théorème des projections relativement aux 
côtés a, b, c dans l'ordre, de multiplier respectivement 
par a, — b,— c, et puis d'additionner membre à membre. 

Dans le cas particulier d'un triangle rectangle en A, 
l'expression se réduit au bien connu théorème de Pytha- 
gore. 

On a encore en trigonométrie plane d'autres 
formules comme celles de Neper et de Briggs qui per- 
mettent d'exprimer une fonction trigonométrique d'un 
angle d'un triangle en fonction des autres angles et des 
côtés de ce triangle. Ces formules ont de multiples appli- 
cations et permettent d'obtenir, en particulier, de nou- 
velles expressions de la surface d'un triangle comme la 
formule d'Erone : 

S = Jp (p— 2) (p—b) (p—c), 
où a, b, c sont les longueurs des trois côtés du triangle et 


1 . : 
p=;(a+b+c). 
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Applications de la trigonométrie plane 


Les fonctions trigonométriques et les formules de trigo- 
nométrie ont d'importantes et nombreuses applications. 
Les premières constituent un puissant moyen de calcul 
en mathématiques, en physique et dans toutes les sciences 
dont la théorie se base sur l'analyse mathématique, les 
secondes permettent de résoudre des problèmes pra- 
tiques de mesure, de distances et de calcul d’angles, 
en topographie, en géodésie, en astronomie. 

Les fonctions trigonométriques sont évidemment très 
importantes pour la représentation des phénomènes 
périodiques. On peut écrire les développements de sin x 
et cos x en séries entières (voir Analyse) en exprimant x 
en radians : 


È qyn+i x2n +1 
sin x = (— 1) Gn+ ni 
n=0 
+ © 
x 
cos x= D (—1) 1 
n=0 


Ces relations permettent de définir aussi les fonctions 
trigonométriques pour des valeurs complexes de x. 
On peut aussi en déduire la formule d'Euler : 


eit — cos x + j sin x. 


Dans beaucoup d'ouvrages d'analyse, les fonctions 
trigonométriques sont introduites par la définition sui- 
vante : pour x réel, on appelle respectivement cosinus et 
sinus de x les parties réelles et imaginaire de e?, soit : 
eir — cos x + / sin x. Il en résulte que : 


eît L et 

cos t mr. 
: eît — e— it 
sin { — DD 


et on déduit de ces formules et des propriétés de la fonc- 
tion exponentielle les propriétés des fonctions trigono- 
métriques. 


Pineider 


Trigonométrie hyperbolique 


Donnons aussi les définitions des fonctions hyperbo- 
liques qui jouent pour la géométrie du plan hyperbolique 
le même rôle que les fonctions circulaires pour le p/an 
euclidien. Pour tout x réel, on appelle cosinus hyperboli- 
que de x, sinus hyperbolique de x, et tangente hyperbo- 
lique de x, respectivement les nombres : 


chx=3 (Er + 87) 


shx= > (4— 477) 
DE NS | 
Hesse = 


Remarquons que le cosinus hyperbolique est une fonc- 
tion paire, tandis que les deux autres sont des fonctions 


impaires. Un calcul simple montre que l'on a : 
ch? x — sh2 x — 1 pour tout x. 


Par dérivation, on obtient facilement : 


(ch x)’ = sh x, 
(sh x)’ = ch x, 
| 
/ DR 
(th x) 1—th2x Ex 


En considérant la définition de ch x, on s'aperçoit que 
ch x est toujours > 1, et il en résulte que sh x est une 
application strictement croissante de R dans R. On voit 
que sh x tend vers — 00 et + 0° pour x tendant respecti- 
vement vers — co et +— 00 : cette fonction est donc bijec- 
tive de R sur R. Puisque sh 0 = 0, le nombre sh x est 
du signe de x; par suite, la fonction paire ch x est stricte- 
ment croissante pour x > 0; d'autre part, ch x tend vers 
+ co quand x tend vers + 0 ou vers — co. Enfin la 
fonction th x dont la dérivée est toujours strictement 
positive, est strictement croissante, et pour x tendant vers 
l'infini, on a: 

lim thx=—1, lim 
X—>— © X— + © 


on en déduit que th x est bijective de R sur ]— 1, — 1[. 


thx= +1; 


A9 


fig. | 


On désigne par Arg sh x la bijection réciproque de R 
sur R de sh x, par Arg ch x la bijection réciproque de 
[1, + cof sur R+ de ch x, et enfin par Arg th x la bijection 
réciproque de ]J— 1, + 1[ sur R 


y = ArgshxxeR<æ x=shy, yeR 
y = Agchxx>1< x=chy, y > 0 


y= Argthx—1<x<+1e x=thy, yeR 


Trigonométrie complexe 


Les fonctions trigonométriques circulaires et hyper- 
boliques s'étendent au domaine complexe de manière 
naturelle, en utilisant les développements en série ou (ce 


AL EE EE Que 


FEPHEF 


qui revient au même, puisque e? est défini comme somme 
d'une série) au moyen des formules : 

eiz + e iz 

2 2i 
e? + e— 2z 
2 2 

qui mettent en évidence, par passage au domaine 
complexe, les liens étroits entre la trigonométrie circulaire 


et la trigonométrie hyperbolique. Ces fonctions sont analy- 
tiques dans tout le plan, et on a des relations du type : 


COS Z — 


chz= 


chz = cos /z sin /z = ish z 


qui sont valables en particulier quand z est un nombre réel 
et qui permettent de déduire la trigonométrie hyperbolique 
de la trigonométrie circulaire et réciproquement. 


Applications pratiques 


Pour les problèmes qui ont trait à la résolution des trian- 
gles, on mesure les angles en degrés. On va exposer quel- 
ques problèmes typiques dans lesquels interviennent des 
formules de trigonométrie : il sera ici simplement ques- 
tion de problèmes de topographie et d'astronomie où 
n'existent matériellement que les sommets des triangles. 
La mesure des angles se fait au moyen d'un théodolite. 

Dans la résolution des problèmes, on notera b la base 
qui est une longueur de référence dont la valeur est 
connue ; elle est choisie de telle sorte que le triangle dont 
elle fait partie soit celui dont on veut déterminer un 
élément. 

Distance d'un point O à un point P visible, mais non 
accessible 


On mesure la base AO = b et les deux angles 8 — GAP 
et « — AOP. Du théorème du sinus, on déduit (fig. 13) : 


sin 8 sin 8 
OP — AO 2 : 
sin APÔ sin (x + 8) 
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<« Figure 12 :les 
fonctions hyperboliques. 


Y Figure 13 : 
détermination de la 
distance d'un point O 
à un point P visible, 
mais non accessible. 


> Page ci-contre, 

à gauche, figure 18: 
théorème du cosinus; 
figure 19 : 

théorème du sinus. 


Figure 14: 
détermination de la 
hauteur d'une montagne 
relativement à 

un plan horizontal 
passant par un point O. 


Richard Colin 


Page ci-contre, à droite : 
on appelle 

triangle sphérique 

Ja partie de la surface 
délimitée par trois arcs 

de grand cercle 

reliant les points 

deux à deux. 


Figure 15: 
détermination de la 
distance de la Lune. 

Figure 16 : 
détermination de la 
distance du Soleil. 
Figure 17 : 

triangle sphérique. 


Il existe une méthode semblable pour mesurer la distance 
de deux points A et B visibles, mais non accessibles. 
Hauteur d'une montagne relativement à un plan 
horizonta| passant par un point O 
Soit V le sommet de la montagne et A le pied de la per- 
pendiculaire abaissée de V sur le plan horizontal passant 
par O (fig. 14). 


On mesure la base OO’ = b, qui en général n'appartient 
pas à un plan horizontal, et les angles «, B, 8’. 


sin 8’ 
OV = b—"—, Xe _ Au 
ain GVOr OVO = 180°— (B +R) 
AV = OV sin & 
et en substituant, on obtient : 
sin 8” sin « 
GES (8 + 8°) 


Distance de Ja Lune 

On se trouve ici dans le cas du premier problème où P 
représente la Lune, et À et O deux points de la surface 
terrestre. On peut par exemple prendre comme base le 
rayon terrestre et lire la hauteur de la Lune en un point M’, 
celle-ci étant au zénith d’un point M” situé sur le même 
méridien que M. Appliquons le théorème du sinus 
(fig. 15) : 


R OL 
—— 
sin M'LO sin LM’O 
où R est le rayon terrestre ; en tenant compte de 
ae. 
OM'L = 90° + 8, 


nt 
M'LO = 180° — (x + 8 + 90°) — 90° — (x + B), 
on obtient : 


cos B 
cos (x + 8) 


OL=R 


Distance du Soleil 

Le problème ne peut pas se résoudre comme pour la 
Lune parce qu'une base quelconque de la Terre sera 
toujours trop petite par rapport à la distance à mesurer. 
Soit / la distance Terre-Lune. On mesure « quand la Lune 
est exactement à son premier quartier: la distance cher- 
chée Terre-Soleil ds est ainsi l'hypoténuse d'un triangle 
rectangle dont on connaît un côté et un angle (fig. 16) : 


/ 
ds 
COS x 


Il existe aussi une méthode pour calculer la distance 
des étoiles. 


Trigonométrie sphérique 


Considérons sur une surface sphérique de rayon R 
trois points n'appartenant pas au même grand cercle; 
on appelle triangle sphérique la partie de la surface 
délimitée par trois arcs de grand cercle (plus petits qu'un 
grand demi-cercle) reliant les points deux à deux (ceux-ci 
représentent sur la sphère leur distance minimale). La 
longueur des côtés du triangle sphérique est égale au 
produit du rayon de la sphère par l'angle au centre qui 
les sous-tend; l'angle sphérique est l'angle plan que 
font les deux tangentes aux deux côtés en leur point 
d'intersection. 

Étant donné un côté d'un triangle sphérique, on peut, 
en le considérant comme un arc, parler d'une de ses 
fonctions trigonométriques. À tout angle d'un triangie 
sphérique, on peut faire correspondre un arc : on mène 
par le sommet de l'angle un diamètre de la sphère et le 
plan qui lui est perpendiculaire et qui passe par le centre 
de la sphère; ce dernier intersecte la sphère selon un 


grand cercle C qui, à son tour, rencontre les côtés de 


l'angle en deux points P et P’ (fig. 17). L'arc PP de C 
est l'arc cherché correspondant à l'angle x : puisque 


= 4, on a PP’ — x: R. On n'en déduira pas que les 
éléments d'un triangle sphérique peuvent être considérés 
indifféremment arcs ou angles; dans ce paragraphe, 
on les mesurera en radians (en prenant le rayon comme 
unité de mesure, la mesure d'un côté donne aussi sa 
longueur). 

La mesure de tout angle et de tout côté d'un triangle 
sphérique est comprise entre 0 et x. 

À tout triangle sphérique, on peut faire correspondre 
un trièdre de sommet O (centre de la sphère) et dont les 
arêtes passent par les sommets du triangle. Des propriétés 
du trièdre, on peut déduire celles du triangle sphérique : 

— un côté est plus grand que la différence et plus 
petit que la somme des deux autres; 

— la somme des côtés est comprise entre O et 2 x; 

— la somme des angles est comprise entre x et 3 x; 

— un angle externe est plus grand que la différence 
et plus petit que la somme des deux angles internes 
opposés : 
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— à des angles égaux, correspondent des côtés 
égaux ; au plus grand angle est opposé le plus grand côté. 
On appelle excès sphérique d'un triangle la quantité 
dont la somme des angles du triangle sphérique dépasse 
celle des angles du triangle plan. En utilisant les nota- 
tions introduites pour les triangles plans, on a: 


e=u+B+y—7. 


l 


Pour la résolution des triangles sphériques, on peut 
établir des équations algébriques entre les fonctions cir- 
culaires des côtés et des angles. 


Théorème du cosinus 

On mène par un sommet, par exemple A, d'un triangle 
sphérique ABC, les tangentes aux deux côtés b et c 
(fig. 18) afin qu'elles rencontrent les deux autres arêtes 
du trièdre correspondant au triangle. En égalisant les 
deux expressions de HK obtenues avec le théorème de 
Carnot appliqué aux deux triangles plans HAK et HOK : 


HK2 = AH2 + AK2-— 2 AH AK cos x 
HK2 = OH2 + OK2— 2 OH OK cos a 


AK = AOtïtgc, AH = AO ig b 
= . ou = 2. 
cos C cos b 


En égalisant et en substituant, on obtient : 
cos a — cos b cos c + sin b sin c cos &. 


En écrivant les deux formules analogues, on a les sys- 
tèmes suivants qui permettent de calculer trois éléments 
d'un triangle, connaissant les trois autres : 


cos a — cos b cos c + sin b sin c cos x 
cos b — cos c cos a +— sin c sin a cos & 
cos c — cos a cos b + sin a sin b cos y 


Théorème du sinus 
En partant toujours du triangle sphérique ABC, on mène 


de A la perpendiculaire AH au plan BOC et de H la per- Ë 


pendiculaire aux rayons OB et OC (fig. 19). En tenant 
ne Pre 


compte que par construction ANH = + et AMH = & 
(AM et AN sont perpendiculaires respectivement à 
OB et OC),ona: 


AH = AM sin 8 = R sin c sin 8 
AH = AN sin y = R sin b sin Y. 
En égalisant, on obtient : 
sin c sin 8 = sin b sin y 


E, Rousseau - Sn: 


UIIIIITENT 
LA 
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> La coupe dans une 
coguille de nautile 
montre la succession 
des loges qui constituent 
une spirale 

à angle constant 

(spirale logarithmique). 


> 
[= 
a 

= 


Ce 


et l'énoncé du théorème est : dans tout triangle sphérique, 
les sinus des côtés sont proportionnels aux sinus des 
angles opposés : 


sin c 


A partir des formules des théorèmes du cosinus et du 
sinus, il est possible de résoudre un triangle sphérique; 
comme il a déjà été vu avec les triangles plans, il est préfé- 
rable d'utiliser aussi pour les triangles sphériques des for- 
mules qui permettent de déterminer immédiatement quel- 
que élément inconnu. On tire de ces théorèmes l'expres- 
sion des plus connues, comme celles de Delambre et 
Neper. 
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GÉOMÉTRIE ANALYTIQUE 


La géométrie analytique permet d'étudier, à l'aide de 
l'analyse, les problèmes géométriques. C'est l'expression 
d'une réalité géométrique par une relation entre des varia- 
bles grâce à l'usage d'un système de référence, ou système 
de coordonnées, et au principe de la représentation gra- 
phique. 

Dans l'Antiquité, les coordonnées étaient surtout uti- 
lisées pour permettre des représentations astronomiques 
ou topographiques, mais déjà les Grecs, Archimède et 
surtout Apollonios, s'apercurent de la possibilité de 
donner une forme graphique à des équations : Apollonios 
écrit explicitement les équations des coniques en coor- 
données obliques. Plus tard, les développements de 
l'algèbre furent accompagnés de tentatives de résolution 
par l'intermédiaire d'interprétations géométriques, et la 
géométrie analytique, sous une forme encore très rudi- 
mentaire, fut utilisée avec un intérêt croissant par diverses 
branches mathématiques naissantes. Fermat et surtout 
Descartes, avec son œuvre Géométrie en 1637, lui fourni- 
ront un apport fondamental; c'est au XVIIIe siècle qu'elle 
prendra son essor et la forme qu'on lui connaît aujourd'hui. 
Elle s'étend alors à l’espace, et tous les grands mathéma- 
ticiens de l'époque contribueront à son développement : 


citons en particulier Euler, Lagrange et Monge. Outre les 
problèmes qu’elle permet de résoudre, la géométrie ana- 
lytique a contribué à la naissance et au développement de 


dans diverses branches des 
révéler extrêmement 


nombreuses recherches, 
mathématiques, qui allaient se 
fécondes. 

L'étude analytique d'un problème géométrique peut se 
séparer en trois phases : 

— traduction des liens géométriques entre les élé- 
ments de la figure en expressions algébriques ; 

— résolution purement analytique ; 

— interprétation géométrique des résultats obtenus. 

Nous allons voir ici les notions fondamentales qui per- 
mettent d'aborder une résolution en général et nous 
allons traiter, dans le plan et dans l'espace, les problèmes 
géométriques d'intérêt majeur. (Pour des développements 
ultérieurs, on pourra se reporter à la 7opologie.) 


Géométrie analytique plane 


Coordonnées cartésiennes 


Choisissons dans un plan deux droites orientées x’Ox 
et y’Oy (les axes) qui se coupent en. O _forigine), et 


fixons sur chacune un vecteur unitaire, + eti: on a cons- 


truit un système de référence cartésien. Si P1 est un point 
du plan, traçons par P1 les parallèles aux axes; chacune 
rencontre l'autre axe en un point H et K (#g. 1). Les coor- 
données cartésiennes (x1, y1) de P1 sont les mesures des 
segments OH, OK; xi est l'abscisse de P1, y: son ordonnée. 
Réciproquement, le couple (x1, y1) étant donné, l'inter- 
section des droites parallèles à Oy et Ox menées par le 
point H d'abscisse x1 sur Ox et le point K d'abscisse y1 
sur Oy est un point P1 unique. On a donc une corres- 
pondance biunivoque entre l'ensemble des couples 
(x1, y1) éléments de R? et le plan rapporté à un système 
d'axes de coordonnées. A partir des points O et P1, 
on peut définir le vecteur OP:, et on peut écrire : 


2e = NA 
OP1 — x1i + yij 
e —> 
où x1, y1 sont les composantes du vecteur OP:. 
Si P1 (x1, y1) et P2 (x2, y2) sont deux points du plan, 
le vecteur d'origine P1 et d'extrémité P2 est le vecteur 
—_—— ee — — ——> 
P1P2 = (x2— Xi) i + (y2— y1) j = OP2— OP: 
Si les unités de mesure sont égales, nous pouvons utili- 
ser la formule de Carnot (voir 7rigonométrie) pour calculer 


la longueur du vecteur P1P>2, qui est aussi la distance des 
points P1 et P2: si x est l'angle formé par les axes Ox et Oy, 
on aura : 


== 
2| 


x)? + (y2— 1)? —2 (x2— x) (y2— y) cos & 


Outre des unités de mesure égales, on prend habituelle- 


= Ce 


ment 5 
normé (c'est ce que nous utiliserons par la suite) ; dans 
ce cas, les composantes d'un vecteur coïncident avec 
ses projections orthogonales sur les axes, cos x — 0, et la 
formule de la distance de deux points se réduit à l'expres- 
sion du théorème de Pythagore. 


et on obtient ainsi un système cartésien ortho- 


Changements de systèmes de coordonnées 

Pour résoudre certains problèmes, il peut être utile, et 
même parfois indispensable, de passer à un deuxième 
système de référence obtenu d'abord par translation de 
l'origine et ensuite par une rotation des axes (c'est le cas 
le plus fréquent de passage entre deux systèmes cartésiens 
orthonormés). Comme le montre la figure 2, on trouve 
facilement les nouvelles coordonnées X et YŸ du point 
P (x, y) en fonction des anciennes coordonnées, de la 
rotation et de la translation (qui amènent les axes Ox et Oy 
à coïincider avec les axes OX et OY) ; on aura: 


X = x cos 6 — y sin 8 + Xo 
= y cos 8 + x sin 0 + Yo 
Autres types de coordonnées 


Comme nous l'avons vu, un système de coordonnées 
dans un plan est une correspondance (biunivoque dans 
le cas cartésien) entre ce plan et R?; si l’on fixe l’une des 
coordonnées, on obtient une courbe coordonnée : dans 
le cas d’un repère cartésien, les courbes coordonnées sont 
des droites parallèles aux axes. Ce type de coordonnées 
est commode lorsqu'on a affaire à des figures polygonales 
(par exemple pour des calculs de longueurs ou d'aires). 
Mais dans d'autres cas, il sera de loin préférable de choisir 
un système dans lequel les courbes coordonnées sont du 
même type que la figure géométrique que nous voulons 
étudier. Nous allons voir ainsi trois autres types de coor- 
données. 


Coordonnées polaires 
Fixons-nous une demi-droite orientée Ox de vecteur 
> 
unitaire i (axe po/aire) et d'origine le point O (pôle); 
les coordonnées polaires d'un point P sont : Ja distance 
— [ob| (rayon vecteur) et @ l'angle LE OP) (angle 
polsite) [fig. 3]. Pour passer des coordonnées polaires 
aux coordonnées cartésiennes d'un système orthonormé 
tel que l’axe polaire coïncide avec l'axe Ox et le pôle 


avec l'origine, on a immédiatement : 
x = p cos Ô o = Vx2 + y2 


y = psin 0 8= Arctg7 
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À Figure :1es 
coordonnées cartésiennes 
dans le plan. 

Figure 2 : changement 

du système de référence 
obtenu par translation 

de l'origine puis par 
rotation des axes. 

Figure 3 : les coordonnées 
polaires : e, rayon vecteur; 
6, l'angle polaire. 


> Un autre type de 
construction complexe 
engendrée par la nature : 
une graine isolée 
d'Erodium ou 

« bec-de-héron » 
(Géraniacées) constitue 
une torsade spiralée. 


> 
E 
S 
a 
ne 
35 
PA 
O 


Si on veut avoir une correspondance biunivoque entre 
les coordonnées polaires des points du plan et les points 
de ce plan (à l'exclusion du pôle), on doit ajouter les 
deux conditions : 0 < p < oo et 0 < 6 < 27; le pôle est 
défini par la seule condition p = 0, 8 étant arbitraire; on 
l'appelle point singulier du système de coordonnées. 
Si, au contraire, on veut éviter la discontinuité qui résulte 
du pôle, on peut utiliser les coordonnées généralisées 
avec # et 8 variant de — 00 à +— oo qui ne sont évidemment 
plus en correspondance biunivoque avec les points du 
plan. Les courbes coordonnées sont des cercles de centre O 
et des demi-droites d'origine O (fig. 4). 


Coordonnées bipolaires 

Soit F et F’ deux points fixes appelés pô/es ou foyers; 
les coordonnées bipolaires d'un point P sont les deux 
distances 9 et ?’ de P à F et F’. Il n'y a pas de correspon- 
dance biunivoque entre les coordonnées bipolaires et les 
points du plan puisque à chaque couple (+9, »’) (dont la 
somme est supérieure ou égale à la distance FF”) corres- 
pondent deux points qui sont symétriques par rapport à la 
droite passant par F et F’. Les courbes coordonnées sont 
des cercles ayant pour centre les deux foyers (fig. 4). 


coordonnées cartésiennes coordonnées polaires 


coordonnées bipolaires coordonnées elliptiques 
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Coordonnées elliptiques 

Fixons-nous deux foyers F et F” comme pour les coor- 
données bipolaires; les deux coordonnées elliptiques 
d'un point P sont respectivement la somme et la diffé- 
rence des deux coordonnées bipolaires : 


= 9 + 9’ = p9— 9° 
Up TR VEP=r 


Les courbes coordonnées sont des ellipses et des hyper- 
boles de foyers F et F” (fig. 4). 


La droite 


Fixons-nous un repère orthonormé dans le plan. La 
droite est le lieu géométrique caractérisé par la propriété 
suivante : le rapport des composantes de n'importe quel 
vecteur dont l'origine et l'extrémité sont sur la droite est 
constant. Considérant un vecteur ayant pour origine le 
point Po (Xo, Yo) sur une droite D et pour extrémité un 

(Y — Yo) 


point P (x, y) variable de D, on aura -——— — constante. 
(x — Xo) 


Notons que l'expression analytique d'une droite ou d'une 
courbe en général est constituée d'une (ou plusieurs) 
équation qui lie les coordonnées des points de la courbe : 
un point appartient à la courbe si et seulement si ses coor- 
données vérifient l'équation (ou les équations simulta- 
nément). Si on choisit une valeur pour une des deux 
variables, l'équation permet en principe de trouver la ou 
les valeurs de l'autre. 

Les composantes d'un vecteur libre unitaire parallèle 
à une droite, 


sont appelées cosinus directeurs de la droite. Un vecteur 
libre parallèle à la droite sera un vecteur directeur de 


ce . 
la droite. Les projections de r, vecteur directeur unitaire, 
Le 
ne sont autres que les cosinus des deux angles que former 
+ > 
avec i et j, vecteurs unitaires des axes. Si on prend un 


vecteur PoP1 constant et un vecteur PoP variable tous les 
deux sur une droite donnée (fig. 5), on peut écrire : 


Y=Y0. Yi=Y0_ HS 
1 = = = \ É 0 
(1) X—X0 X1—X0 À GA 0 

La première égalité fournit l'équation de la droite pas- 
sant par deux points Po (xo, Yo) et P1 (x1, y1). Le rapport: 


æ 
. = 

À 
est la tangente de l'angle formé par la droite avec l'axe Ox 
et appelé coefficient angulaire où pente de la droite. 
En introduisant les symboles a, b, c, p, fonctions des 


constantes xo, yo, À et 4, on obtient la forme : 
ax+—by+c—=0 où y=mx+p 


Si on veut mettre en évidence les segments À et # 
déterminés par l'intersection de la droite avec les axes 
de coordonnées, on peut écrire l'équation sous la forme : 


I 
LANCER 
qui s'obtient facilement à partir de l'équation (1) en 
prenant comme points Po et P1 les deux points d'inter- 
section de la droite avec les axes. 

Nous allons mentionner enfin les équations paramé- 
triques de la droite qui nous donnent immédiatement les 
coordonnées, en fonction d'un paramètre #, des points 
d’une droite passant par Po (xo, Yo) et de vecteur direc- 


teur V de composantes À et u: 
X = Xo + Àt 
y = yo + ut 
En éliminant £, on retrouve une des formules précéden- 
tes. Partant de (1 ), on obtient les équations paramétriques 


en posant : 
X — X0 


t—= = 
U À 

L'équation y — mx + p, avec m constante et p un 

paramètre variable, représente un faisceau impropre de 

droites, c'est-à-dire toutes les droites admettant pour 

vecteur directeur un vecteur de composantes À et LL 


A , 
telles que = m. Plus généralement, l'équation du pre- 


mier degré, combinaison linéaire de deux droites quel- 
conques 


æ (aix + b1y + c1) + B (a2x + bay + c2) = 0 


représente toutes les droites d'un faisceau. |l est propre 
si les deux droites passent par un point M (l'équation 
est alors la représentation de toutes les droites passant 
par M), impropre lorsque les deux droites sont parallèles 
(voir Géométrie). 

Pour trouver la condition de perpendicularité de deux 
droites, on peut rappeler l'expression du produit scalaire 
de deux vecteurs. Si 

— _ + _— — ES 
u = &i— b1j et v = æiet bo] 
sont un vecteur directeur de chacune des droites respec- 
tivement, les droites forment un angle « tel que 


> —+ >| > : 
u*v—= lui: ME cos &« — a142 + b1bo 
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A Figure 5: 

Ja droite dans le plan : 
le vecteur libre unitaire 
parallèle à la droïte (r) 
et les cosinus directeurs 
(x et 2). 


<« Figure 4 : coordonnées 
dans le plan et 
courbes coordonnées. 


et lorsque « est un angle droit, on doit avoir 


> — bi a2 1 
u' V — 4182 bib: — O ou ; 
41 b2 m2 


Il en résulte la règle suivante : une condition nécessaire 
et suffisante pour que deux droites soient perpendiculaires 
est que leurs coefficients angulaires vérifient la relation 


mime = — 1. 


Le problème géométrique de l'intersection de deux 
droites se ramène au problème purement algébrique de la 
résolution d’un système de deux équations du premier 
degré à deux inconnues x et y. De facon analogue, le 
cas plus général de l'intersection de lieux géométriques 
représentés par des équations revient à la résolution du 
système formé par ces équations. 

Pour trouver l'aire S d'un triangle de sommets P1 (x1, 2), 
Po (x2, y2), Pa (xs, y3),on a la formule suivante : 

1 
S=S [Ge — x1) (ys— 1) — (en) Gs—x) |: 
(En coordonnées obliques, il faut multiplier cette expres- 
sion par sin %.) 


Le cercle 


L'équation d'un cercle dans un système orthonormé 
se trouve exprimée analytiquement comme le lieu des 
points situés à une distance constante d'un point fixé. 
Si on appelle C (x, 8) le centre et 7 le rayon, un point 
sera à une distance r de C si et seulement si: 


(x— a} + (y— PR =7r 
qui devient : 


X2L y2—24x—28y +7 


O (y=a2+ B2— 72), 


On obtient ainsi une équation du second degré à deux 
inconnues qui présente les deux caractéristiques sui- 


vantes : les termes en x? et y? ont le même coefficient, 
et il n'y a pas de terme en xy. Étant donné une équation 
possédant ces deux caractéristiques : 


cy+d=0 (240) 


ax? + ay? + bx - 

on peut encore l'écrire : 
fe. 0 DIN … CN. d  [b\2 c \? 

(x +35) (r+3) ‘a (=) -() à 


Pour que cette équation soit celle d’un cercle de centre 


{ b c 
fete = É : ï 
(= 33! 5 -). de rayon r, il faut et il suffit que 


la valeur de 7 ainsi trouvée soit réelle : 


: B\®. Le Fr d 
É G :) ; G a a 
L'équation de la tangente à un cercle en un point 
Po (xo, yo) se déduit de la propriété d'orthogonalité entre 
le rayon et la tangente ; les cosinus directeurs du rayon CPo 
sont proportionnels à xo — x et yo — 8, et l'équation de 
la tangente est (fg. 6) : 


(Xo— x) (x — Xo) + (yo— 8) (y — yo) = 0 


En coordonnées polaires, l'équation d'un cercle centré 
au pôle, de rayon 7, se trouve considérablement simpli- 
fiée ; elle s'écrit en effet : p = r. 


Les coniques 


On désigne sous le nom de coniques les courbes obte- 
nues par intersection d'un cône par un plan. 

On se fixe : une droite f (directrice), un point F (foyer) 
et un nombre réel positif e fexcentricité); on appelle 
conique propre (ou non dégénérée) réelle le lieu des 
points P du plan qui satisfont la relation PF = r (cons- 


PE PT 
tante) ou bien 55 — e où D est la projection orthogonale 


ellipse 


cercle 


hyperbole 


droites sécantées 


de P sur f, Dans le premier cas, on a le cercle de centre F, 
de rayon r. Dans le second, on peut choisir un système de 
coordonnées (fig. 7) tel que l'axe Ox coïncide avec la 
droite perpendiculaire à f passant par F. On appelle c et 
respectivement les abscisses de F et D par rapport à une 
origine que nous fixerons tout à l'heure. La conique est le 
lieu des points dont les coordonnées sont les solutions 
de l'équation : 


(1 — e2) x2+ y2— 2 (c—e2h) x + c2— eh? = O. 


Cette expression n'est pas la forme la plus générale de 
l'équation d'une conique à cause du choix particulier de 
l'axe Ox : on démontrera cependant qu'une équation 
quelconque du second degré à deux inconnues se ramène 
à l’un des cas suivants : 

a) il n'y a pas de solution réelle : dans ce cas, on 
parle de courbe imaginaire ; . 

b) le premier membre est le produit de deux poly- 
nômes linéaires, dans ce cas la conique est réduite à une 
ou deux droites : on parle de conique dégénérée ; 

c) c'est l'équation d'une conique propre réelle. 

Pour étudier les propriétés des coniques, nous allons 
choisir l'origine O du système de coordonnées de manière 
à rendre l'expression analytique de celles-ci la plus simple 
possible. 


Dex 
On choisira O tel qu'on ait l'égalité A het on orien- 


tera l'axe Ox de O vers F : l'équation peut alors s’écrire 


x2 y? 
2 n C ah 
a (—z 
C Ce 
On peut poser a — é b?2= + (1 —e2) = et on devra 


considérer deux cas, selon que e est supérieur où inférieur 
à 1; on obtient ainsi les deux types de coniques propres 
dont les équations peuvent s’écrire : 


(1) x2 k y? 


e< FR 


1 


105 


Richard Colin 


« Sections coniques 
d’Apollonios : 

Apollonios découvrit 

que la section par un plan 
d'un cône à base circulaire 
engendre des courbes 

ou coniques. 


v Figure 6; le cercle 

de centre C (x, &), 

de rayon r, et sa tangente 
au point Po (xo, Vo). 


1.G.D.A. 


I.G.D.A. 


A Figure 7 ; système 

de référence pour une 
conique : l'axe x coïncide 
avec la droïte passant par 
le foyer F et 
perpendiculaire à la 
directrice f. 


» Figure 8 : l'ellipse. 


Richard Colin 


Figure 9 : l'hyperbole. 


Richard Colin 


LE: Cte:e e74 
PD 
PF'-PF: Cle -: 2a 


fig. 9 


(si a — b, on a un cercle) 
x2 y? 
(2) e > 1 2 Bas 1 
In e= 1 
Choisissons l'origine des axes au milieu de FDo: on 
a ainsi : 
(3) y?2—4cx= 0 


Si l'équation d'une conique peut se mettre sous la 
forme (1), on l'appelle une e/lipse, sous la forme (2) 
une hyperbole, et sous la forme (3) une parabole. 

Nous allons maintenant étudier séparément ces trois 
coniques. 


L'ellipse 

Considérons l'équation (1). L'origine O, centre de 
l'ellipse, est centre de symétrie, les axes Ox et Oy (axes 
de l'ellipse) sont axes de symétrie. Si on explicite l'équa- 
tion en x et en y, on trouve 
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comme les expressions situées sous le radical doivent être 
positives, tous les points de la courbe sont situés à l'inté- 
rieur ou sur le rectangle centré à l'origine et de côtés 2 a 
et 2 b (fig. 8) ; les quatre points situés au milieu des côtés 
de ce rectangle sont les sommets de l'ellipse, a et b les 
demi-axes. En utilisant les deux égalités 


c2 
2 = RES 2 
a? — b2= (1 €) => 


on obtient l'expression de la distance focale en fonction 
des demi-axes : c? = a? b?; le foyer F est donc situé 


; : : ' € 
entre © et À. La directrice a pour équation : x — De 


et le point Do est donc à l'extérieur de OA. Par symétrie 
de la courbe, on a un autre foyer F’ et une autre directrice f’ ; 
l'axe Ox sur lequel sont situés les deux foyers est appelé 
axe focal. 

L'équation de la tangente à l’ellipse en un point Po (xo,Yo) 
est : 

AA e YPO 
a  b?. 

Citons encore une propriété de l’ellipse : la somme des 
distances d'un point P de l'ellipse aux deux foyers est 
constante et égale à 2 a. 

La représentation paramétrique de l'ellipse est : 


— b sin 6 
C4 ” TS LU 
où 6 est l'angle du vecteur OP avec l'axe Ox. En élevant 


au carré, en divisant la première égalité par 42, la seconde 
par b? et en ajoutant, on retrouve bien l'équation (1). 


x—acos 


L'hyperbole 

Revenons à l'équation (2). De même que pour l'ellipse, 
l'origine O est centre de symétrie (centre de l'hyperbole), 
les axes de coordonnées sont des axes de symétrie. En 
explicitant l'équation, on obtient : 

= LS 
y Ex a \x a*. 

L'hyperbole passe donc par les deux points A (a, O) et 
A’ (— a, 0) appelés sommets et se trouve à l'extérieur de 
la région du plan délimitée par les deux droites x — — a 
et x = a (elle ne rencontre donc pas l'axe Oy) ; elle admet 


s © on pe 
X= +— + p? 
= 


: . 
comme asymptotes les deux droites y — + < x dont elle 


se rapproche lorsque x tend vers l'infini, et est constituée 
de deux branches, comme on le voit sur la figure 9. Comme 
l'ellipse, elle a deux foyers F et F” situés à l'extérieur du 
segment AA’ : des égalités 


; ; c2 
D = (2— 1): 


on déduit leur distance à l'origine : 


c = a? + p?, 
: : = ne 
Les directrices ont pour équation x = + = etcomme 
e > 1, elles coupent le segment AA’; si l'on trace deux 
cercles centrés en © de rayons respectifs OA = a et 
OF = c, le premier rencontre les asymptotes à leurs points 
d'intersection avec les directrices, le second les rencontre 
à leurs points d'intersection avec les droites x = + a. 
Il en résulte que b représente le segment de perpendiculaire 
à l'axe focal compris entre le sommet et une asymptote. 
La tangente à l'hyperbole en un point Po (Xxo, Yo) a pour 
équation : 
sn; 
a? b2 
Dans le cas particulier où a — b, les asymptotes sont 
perpendiculaires, et l'hyperbole est dite alors équilatère. 
Si on prend comme nouveaux axes de coordonnées 
Ox’ et Oy’ les asymptotes (pas nécessairement perpendi- 
culaires), l'équation de l'hyperbole prend une forme parti- 
culièrement simple : 


1.G.D.A. 


fig. 10 
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En utilisant cette équation de l’hyperbole, on en déduit 
que les parallélogrammes ayant deux côtés sur les asymp- 
totes et comme sommets opposés l’origine O et un point P 
sur l’hyperbole ont une aire constante (fig. 10). 

A = x'y’ sin & = K? sin « (x est l'angle formé par les 
axes de coordonnées). 

Parmi les autres propriétés remarquables de l'hyperbole, 
citons les suivantes : 

a) l'hyperbole est le lieu des points dont la diffé- 
rence des distances à deux points fixes (foyers) est 
constante ; 

b) l'aire du triangle formé par une tangente à l'hyper- 
bole et par les asymptotes est constante, quelle que soit la 
tangente ; 

c) les deux segments P101 et P2Q> (fig. 10), déter- 
minés par l'intersection d'une corde et des deux asymp- 
totes, sont égaux; cela rend très facile la construction de la 
courbe une fois connus les asymptotes et un point. 

Les équations paramétriques de l’hyperbole s'expriment 
à l'aide des fonctions hyperboliques (voir 7rigonomé- 
trie) : 


x = à ché y = b sht où t'est l'angle 


—+ 
formé par OP avec l'axe Ox. 


La parabole 

Regardons maintenant l'équation (3); l'axe Ox (axe 
de la parabole) apparaît comme axe de symétrie. Elle 
admet un seul axe et un seul foyer F. Comme e = 1, 
on voit immédiatement que la parabole est le lieu des 
points équidistants d’une droite (la directrice) et d'un 
point (le foyer). La courbe passe par le milieu du segment 
FDo, sommet de la parabole où elle est tangente à l'axe Oy 
(fig. 11). L'équation de la tangente en un point Po (Xxo, Yo) 
est : 

Yyo — 2 © (x + xo) = 0 


Parmi les propriétés remarquables de la parabole, rete- 
nons : 

a) la directrice est le lieu des points symétriques du 
foyer par rapport aux tangentes, lorsqu'on fait varier celles- 
ci; 

b) lelieu des points qui sont la projection orthogonale 
du foyer sur la tangente, lorsque celle-ci varie, est la droite 
tangente à la parabole en son sommet (axe Oy); 

c) la parabole est la limite d'une ellipse ou d'une 
hyperbole dont on a fait tendre un des foyers vers l'infini, 
l'autre restant fixe. 


Géométrie analytique dans l'espace 


Coordonnées dans l’espace à trois dimensions 


Dans l’espace, un système de coordonnées cartésiennes 
est formé de trois droites orientées (axes Ox, Oy, Oz), 
généralement orthogonales, passant par un point O 


> — 
(origine), munies de trois vecteurs unitaires i, j, k, que 
nous supposerons de longueur égale. Les axes pris deux 
à deux déterminent les p/ans de coordonnées ; les surfaces 
coordonnées (par analogie avec les courbes coordonnées 
dans le plan) obtenues en fixant une coordonnée et en 
laissant varier les deux autres sont ici des plans perpen- 
diculaires à l'axe dont la coordonnée est tenue constante. 
Par extension de ce qui se passe dans le plan, pour repérer 
le point P1 de coordonnées x1, y1, z1 (z1 est la cote) et 


LEE | 
le vecteur OP:, on peut écrire : 
+ Æ LT, Le 
Pa (x1, Ya, 21) OP1 = X1i + 1j + Z1k 
Si P1 et P2 sont deux points de l’espace, le vecteur d'ori- 
gine P1 et d'extrémité P2 s'écrira : 
— — — LS 
P1P2 = OP» OP: = (x2 x1) [I 
; Les ir 
+ (y2— y1) j + (22— 2) k 
et sa longueur, dans le cas d'un système orthonormé, sera : 


_—— RE 
[Pape = 10— x1)2 + (ya — y1)? + (z22— 21) 

En étendant à l'espace les coordonnées polaires par 
l'adjonction de l'axe normal Oz, on obtient les coordon- 
nées cylindriques (ou semi-polaires) : les relations entre 
o, 6, x et y restent les mêmes, et la cote z est la même dans 
les deux systèmes (fg. 12). Dans ce cas, les surfaces coor- 
données sont : 


z = cste : plans perpendiculaires à l'axe Oz; 

6 — cste: demi-plans d'origine Oz et formant l'angle 6 
avec le plan xOz; 

= cste : cylindre d'axe Oz et de rayon &. 


To 


Comme autre extension du système de coordonnées 
polaires, on a le système de coordonnées sphériques : 
les trois coordonnées sont alors (fig. 13) : 


Richard Colin 


=> . . = CE 
e = |OP]| rayon vecteur, distance du point à l'origine ; 
— 


— 
©, latitude, est l'angle (OP1, OP) où P1 est la pro- 
jection orthogonale de P sur le plan xOy; 


—> — 
6, /ongitude, est l'angle (Ox, OP:). 
Les relations entre les coordonnées sphériques et les 
coordonnées cartésiennes sont les suivantes : 


x = ? cos © cos 0; y = 9 cos ® sin 0; z = p sin y; 


et les surfaces coordonnées : 


9 = cste : sphère de centre O de rayon e; 

o = cste : demi-cône de révolution d'axe Oz; 

8 = cste : demi-plan d'origine l'axe Oz et formant 

l'angle © avec le demi-axe positif Ox. 
Choisissant un système dans lequel l'axe Ox coïncide 

avec l'axe terrestre et d'origine le centre de la Terre, en 
coupant les surfaces coordonnées par la surface de la 
Terre (supposée sphérique), on obtient les parallèles 
(o — cste) et les méridiens (8 = cste). 
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<« Figure 10 : deux 
propriétés de l’hyperbole : 
égalité des aires des 
parallélogrammes 
construits sur les 
asymptotes et ayant 
comme sommets opposés 
l'origine et un point P 

sur l’hyperbole ; égalité 
des segments P:1Q1 et P202 
déterminés par 
l'intersection d'une corde 
avec l'hyperbole et les 
asymptotes. 


y Figure 12; 

coordonnées cylindriques : 
s et 8 sont les coordonnées 
polaires du plan et z 
coïncide avec la coordonnée 
cartésienne. 


<« Figure 13 : 
coordonnées sphériques. 


<« Figure 11 : /a parabole. 


Palais de la Découverte, Paris 


1.G.D.A. 


Y Ci-dessous, 
surfaces réglées. 
En bas, figure 14 : 
cylindre et 

cône de révolution. 


La droite et le plan 


L'espace étant rapporté à un système orthonormé, un 
plan peut être défini par un point et une direction perpen- 


diculaire. La direction est donnée par un vecteur libre ü 
de composantes a, b, c, et le point Po par ses coordonnées 
Xo, Yo, Zo. La condition que doivent vérifier tous les vec- 
teurs du plan d'origine Po et d'extrémité un point quel- 
conque du plan, P, est: 


Pob-u — 0; 
explicitant le produit scalaire, on obtient 
a (X— Xo) + b (y — yo) + © (Z— 20) = 0 
et on trouve une équation de type 


ax +— by +cz—d—=0 


Le plan est ainsi représenté par une équation linéaire 
en x, y et z, et on peut voir que toute équation de ce type 
représente un plan perpendiculaire au vecteur de compo- 
santes a, b, c; on peut remarquer que, si une variable ne 
figure pas dans l'équation d'un plan, celui-ci est parallèle 
à l'axe correspondant à la variable manquante. Si deux 
coefficients sont nuls, le plan est parallèle à l’un des trois 
plans de coordonnées. 

Une droite peut être caractérisée comme l'intersection 
de deux plans, et on peut donc la représenter par le système 
formé des équations de deux plans qui la contiennent 
(équations cartésiennes de la droite). On peut aussi la 
définir (comme on l’a vu dans le plan) par un point 


+ 
Po (Xo, Yo, Zo) et un vecteur directeur r (/, m, n), et on 
obtient les « équations paramétriques » de la droite, où 
À est un paramètre : 


X = Xo + NM 
Y = Yo + ÀM 
Z=Z0+ ÀN 
qui peuvent se mettre sous la forme (si les composantes 
de F sont non nulles) 
(x— x0) __(Y— Yo) _ (2) _, 
/ m n 


et on obtient alors la forme normale de l'équation d'une 
droite. 

Si on se donne les équations de deux droites non paral- 
lèles 


(X= x) _ (= ÿ) _ (2) 
li m1 F m1 
(X— x2) __ (Y—y2) _ (Z— 22) 

L _ m2 un n2 ù 


une condition nécessaire et suffisante pour qu'elles soient 
_ _ 
coplanaires est que leurs vecteurs directeurs r1 et r2 et le 
— 


vecteur P1P2 soient coplanaires [où P1 (x1, 1,21) est 
sur la première, P2 (x, y2, z2) sur la deuxième], c'est-à- 
dire : 


X2 — X1 li LB 
Y2—y1 m m2 = 0 
Zi ZT - LH n2 
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Surfaces de révolution et surfaces réglées 


On appelle surface de révolution la surface décrite 
par une courbe quelconque lorsqu'on la fait tourner autour 
d'une droite (axe de révolution) ; une surface est réglée 
si, en n'importe lequel de ses points, il passe au moins 
une droite tout entière contenue dans la surface. 


La sphère 

C'est le lieu des points situés à une distance 7 d’un 
point C (x, B, y) qui est le centre de la sphère; les coor- 
données de ses points vérifient l'équation : 


(x — a) + (y— 8} + (z— y} —r2=0 


L'intersection d'une sphère avec un plan est soit vide, soit 
un point (plan tangent), soit un cercle. 


Le cône et le cylindre 

Étant donné deux droites coplanaires, si l'on fait 
tourner l'une d'elles autour de l'autre (axe de révolution) 
on obtiendra une surface qui sera un cône de révolution 
si les droites se coupent en un point fsommet) où un 
cylindre de révolution si les droites sont parallèles (fig. 14). 
Plus généralement, on appelle cône la surface décrite 
par toutes les droites {génératrices) passant par un point 
fixe et par un point d'une courbe £ (directrice), et cylindre 
celle décrite par toutes les droites parallèles passant par 
un point de £ ; ce sont évidemment, de par leur construc- 
tion, des surfaces réglées. L'équation d’un cylindre de 
révolution d'axe Oz et de rayon r est : 


x2+ y2= 72, 


Celle d'un cône de révolution d'axe Oz, de sommet l'ori- 
gine, est : 
x2+ y2_ mz2= 0. 


Les intersections avec des plans z — h donnent des 
cercles (de rayon r pour le cylindre) centrés sur l'axe Oz, 
alors que les intersections avec des plans contenant 
l'axe Oz seront des couples de droites. 


Les quadriques 


On appelle quadrique toute surface dont l'équation en 
coordonnées cartésiennes est du second degré en x, y et z. 
C'est ce qui correspond, dans l'espace, aux coniques dans 
le plan. Les intersections des quadriques avec les plans 
de coordonnées et des plans parallèles à ceux-ci sont des 
coniques : une fois celles-ci connues, on connaît le type 
et l'allure de la surface. On peut considérer toutes les 
quadriques comme les surfaces décrites par des coniques 
situées dans des plans parallèles lorsque leurs sommets 
décrivent deux autres coniques. Nous avons les types 
suivants : 


Ellipsoïde 
C'est une quadrique qui peut se représenter par l'équa- 
tion suivante : 


Les trois plans de coordonnées la coupent suivant les 
ellipses principales (fig. 15) 


2 2 
plan z = 0 5 + 5 = 1 (de demi-axes a et b) 
x2  z2 ' 
plan y = 0: “LS 1 (de demi-axes a et c) 
y? 2? | 
plan x = 0 Rs 1 (de demi-axes b et c) 


Les plans de coordonnées sont des plans de symétrie 
de l'ellipse, les axes de coordonnées sont des axes de 
symétrie. Tous les points de l’ellipsoïde sont à l'intérieur 
du parallélépipède de côtés 2 a, 2 bet 2 c, et toutes les 
sections pour des plans sont des ellipses. Si deux demi- 
axes sont égaux (par exemple, a — b), on a un ellipsoide 
de révolution (ici autour de l'axe Oz); dans ce cas, les 
intersections avec certaines surfaces coordonnées (ici 
les plans z = h) sont alors des cercles. Si tous les demi- 
axes sont égaux, on obtient évidemment une sphère. 
Un ellipsoïde est la surface décrite par une infinité 
d’'ellipses dont les sommets se déplacent sur deux autres 
ellipses. 


2 
plan x = 0:5—5 = 1 


(hyperbole d'asymptotes z — 2 y) 
Le plan y = 0 ne rencontre pas la surface; les sections 
par des plans y — k avec k < — b ou k > b sont des 
ellipses. Ainsi, cet hyperboloïde est la surface décrite 
par des ellipses dont les sommets se déplacent sur deux 
hyperboles perpendiculaires, mais cette fois deux som- 
mets opposés se déplacent sur la même branche d'hyper- 
bole. 
Les éléments de symétrie sont les mêmes que dans le 
cas de l’ellipsoïide et de l'hyperboloïde à une nappe. 


1.G.D.A. 


À Figure 15 : ellipsoïde. 


<« À gauche, figure 16 : 
hyperboloïde à une nappe. 
A droite, figure 17 : 
hyperboloïde 

à deux nappes. 


1.G.D.A. 


Hyperboloïde à une nappe 
Son équation, lorsque sa position par rapport aux axes 
de coordonnées est celle de la figure 16, est : 


et les sections principales : 


Paraboloïde elliptique 
Si sa disposition par rapport aux axes est celle de la 
figure 18, son équation est : 
x? y? 
2 5 
Il admet les plans xOz et yOz comme plans de symétrie, 
l'axe Oz comme axe de symétrie. Les sections principales 


2z 


2 
planz= dE UE (ellipse de demi-axes a et b) sont : 
a?  b? 2 
x2 z? c plan x=0:%,—2z= 0 
plany=0: == 1 (hyperbole d'asymptotes z = + 2x) 
… F a (parabole d'axe Oz de sommet l'origine) 
Zz : JC 
planx= 05 1 (hyperbole d asymptotesz— +$y) sieti y 0: = à 0 


Cet hyperboloïde admet les mêmes éléments de symé- 
trie que l'ellipsoïde, son intersection avec les axes Ox 
et Oy (il ne coupe pas Oz) nous donne les quatre sommets 
(+ a, 0,0) et (0, + b, 0). L'hyperboloïde à une nappe 
est la surface décrite par des ellipses dont les sommets se 
déplacent sur deux hyperboles, deux sommets opposés 
se déplaçant chacun sur une branche de la même hyper- 
bole. On peut démontrer à partir de l'équation qu'il s'agit 
d'une surface réglée : par chaque point de sa surface 
passent deux droites distinctes lui appartenant tout 
entières. Il est engendré par deux familles de droites telles 
que deux droites prises chacune dans une famille se 
rencontrent toujours alors que deux droites de la même 
famille ne se rencontrent jamais. Si a = b, les sections par 
les surfaces coordonnées z — h sont des cercles, et 
l'hyperboloïde est alors de révolution autour de Oz. 


Hyperboloïde à deux nappes 

C'est la surface représentée sur la figure 17. 

Avec un système de coordonnées bien choisi, son 
équation est : 


(hyperbole d'asymptotes y — +8 x) 


1.G.D.A, 


(parabole d'axe Oz de sommet l'origine) 


L'intersection avec le plan z — 0 est réduite à l'origine, les 
sections par des plans z = k > 0 sont des ellipses cen- 
trées sur l'axe Oz. 

Le paraboloïde elliptique est la surface décrite par des 
ellipses dont les sommets se déplacent sur deux para- 
boles perpendiculaires, de même sommet, de même axe, 
situées du même côté du plan z = ©. 
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A Figure 18 : paraboloïde 
elliptique. 


<« Figure 19 : paraboloïde 
hyperbolique. 


1.G.D.A. 


> Un paraboloïde 
hyperbolique. 


Palais de la Découverte, Paris 


Paraboloïde hyperbolique 
Son équation, dans le système d'axes de la figure 19, 
s'écrit : 


Il admet les mêmes éléments-de symétrie que le para- 
boloïde elliptique ; les sections principales sont : 


(parabole d'axe Oz de sommet l'origine située du 
côté des z positifs) 


2 
plan y=0:—5—2z- 0 


(parabole d'axe Oz de sommet l'origine située du 
côté des z négatifs) 


planz=0:y=— +èx (deux droites) 
FAT 
plan mnt 2 k?2 


(hyperbole d'axe focal parallèle à Oz) 


2 2 
plans z =—k:5-5= 
(hyperbole d'axe focal parallèle à Ox) 


Un paraboloïde hyperbolique est la surface obtenue 
lorsqu'on déplace une parabole dans une direction perpen- 
diculaire à son plan, son sommet décrivant une autre 
parabole, de concavité opposée, située dans un plan 
perpendiculaire à celui de la première et d’axe parallèle 
à celui de celle-ci. 

On a vu qu'il passait par le point O deux droites appar- 
tenant à la surface, et on peut démontrer que c'est une 
propriété que possèdent tous les points du paraboloïde 
hyperbolique. De même que l'hyperboloïde à une nappe, 
il est engendré par deux familles de droites ayant les 
mêmes caractéristiques. 


2 k2 
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TOPOLOGIE 


Considérons les six courbes de la figure 1: elles ne 
sont pas équivalentes d'après les critères de la géométrie 
élémentaire. Toutefois, on remarque intuitivement que 
les courbes 1, 3 et 6 ont des propriétés communes que 
les autres ne possèdent pas : on peut les déformer conti- 
nüment l'une dans l'autre, mais aucune d’entre elles ne 
peut être déformée en les autres. On peut en dire de même 
des courbes 2 et 5. 

On dit que les courbes 1, 3 et 6 sont topologiquement 
équivalentes, ainsi que les courbes 2 et 5; tandis que la 
courbe 4 ne l’est à aucune des autres. Par analogie, les 
surfaces délimitées par un cube ou une sphère sont topo- 
logiquement équivalentes. La topologie est la partie des 
mathématiques qui étudie cette notion intuitive de conti- 
nuité et de limite. 

Jusqu'au début du XIXe siècle, les mathématiciens 
utilisèrent les notions de limite et de continuité sans les 
définir rigoureusement. C'est à cette époque qu'A. Cau- 
chy, N. Abel et B. Bol/zano définirent la limite d’une suite 
numérique et la continuité d'une fonction numérique 
d'une variable numérique ; ce fut le début de la topologie. 

G. Hilbert chercha à axiomatiser les notions de limite 
et de continuité; il introduisit pour cela les voisinages. 
Mais ce furent M. Fréchet et F. Riesz qui, au début du 
XX® siècle, firent les premières études axiomatiques des 
notions de point limite et de continuité. Tandis que 
M. Fréchet fondait son étude sur une notion générale de 
distance, F. Riesz procédait à une définition axiomatique 
directe de la notion de point limite et, de cette façon, 
arrivait le premier à la notion d'espace topologique. Un 
peu plus tard, F. Hausdorff donna aux axiomes de la topo- 
logie une forme à peu près identique à celle qui est utilisée 
aujourd'hui. La notion de compact fut dégagée par 
P.S. Alexandroff, P. Urysohn et A. Tychonov. Enfin, 
vers 1940, la définition des filtres, par H. Cartan, mettait 
un point final à l'histoire de la notion de limite. 


Les espaces métriques 
et les espaces topologiques 


Les espaces métriques 

La notion d'espace métrique, introduite par M. Fré- 
chet en 1906 et développée peu après par F. Hausdorff. 
est directement issue d'une analyse de la distance usuelle. 

L'analyse des principales propriétés de la distance entre 
deux points dans l'espace euclidien conduit à la défini- 
tion axiomatique suivante : on appelle distance sur un 
ensemble E une application d de E x E dans l'ensemble 
R: des nombres réels positifs ou nuls tels que, quels que 
soient les éléments x, yetzdeE,onait: 


a) d'(xy)=0 es x y; 
b) d'(Xy)= d(xy); 
c) d'(x,y) < d'(x,z) + d (z, y). 


Cette dernière propriété est appelée /négalité trian- 
gulaire, car elle est la généralisation de la classique iné- 
galité entre les longueurs des côtés d'un triangle : tout 
côté d'un triangle est au plus égal à la somme des deux 
autres. 

Un ensemble E muni d'une telle distance est appelé 
espace métrique. 

Remarquons que d (x, y) est bien un nombre réel posi- 
tif ou nul : d'après a), c) etb),on a en effet pourtout xety 
appartenant à E : 


O=d(xx)<d(xy)+d(y,x)=24d(x y) 
On démontre aussi l'inégalité : 
d'(xz) > [d(x y) — d (y,2)| 


1.G.D.A. 


(tout côté d'un triangle est au moins égal à la différence 
des deux autres). 

Si (E, d) et (E’, d’) sont deux espaces métriques, une 
bijection f de E sur E’ sera appelée isométrie si elle conserve 
la distance, c'est-à-dire si d’[f(x),f (y)] = d (x y) 
pour tout x et y € E. Deux espaces métriques sont dits 
isométriques s'il existe une isométrie de l'un sur l'autre. 
Ils présentent alors « par transport » des propriétés sem- 
blables. 

Donnons quelques exemples importants d'espaces 
métriques : 

1)  Soitx— (X1 X2,.…., Xn) et y = (V1: V2, …, Yn) 
deux éléments de R?, on pose : 


. (x — yiŸ 


i=1 


da (x, y) = 


On peut facilement vérifier que l'application d : 
Rr x R7 — R: définie par (x, y) — d2 (x, y) est une 
distance sur R?. 

Par définition, d2 est la distance euclidienne sur R?. 

On appelle aussi cette métrique la métrique naturelle 
de R?. 

11) Les applications m et s de Rex R? dans R: 
définies par : 
ñn 


mix. y)= max (Ixi—yiljet s (x y) = 2 [x — yil 


1<i<n 


sont aussi des distances sur R7. On démontre aisément 
que m < d2 < s < nm. On en verra les conséquences 
plus loin. 
IH) Soit E un ensemble quelconque. L'application d de 
EXE—R définie ainsi : 

[1 six£ y 


PRE lO six=Yy 


est une distance sur E. On l'appelle métrique discrète où 
distance triviale. 
IV) Si E est un espace métrique muni d'une distance d, 
tout sous-ensemble À de E est un espace métrique, dit 
sous-espace métrique de E pour la distance induite d' 
définie ainsi : 

d'(xy)=d(xy) x yEA 


V) Soit E un ensemble non vide et f une application 
injective de E dans R. On peut montrer que l'application 
de Ex E dans R définie par: 


(x y) = d'(x y) = |F (x) —f (y) | 


est une distance sur E. 

On verra plus loin que les espaces métriques dont les 

éléments sont des fonctions sont parmi les plus impor- 
tants (voir Analyse fonctionnelle). 
VI) Une classe très importante d'espaces métriques 
est constituée par les espaces vectoriels normés en défi- 
nissant la distance de deux éléments x et y comme la 
norme de leur différence, soit : 


d'(x,y) =[x— y. 

Rappelons la définition d'un espace vectoriel normé 
réel (resp. complexe) : soit E un espace vectoriel sur R 
(resp. C) ; une norme sur E estune application de EdansR, 
notée x — |x]|, telle que, quels que soient x€E, YEE, 
xER (resp. C), on ait les propriétés : 


a) W>0 M =0= x=0 
b) ax = A] lx| : 
c) [x+ y] <|x| + {|y| (inégalité de Minkowski). 


Un espace vectoriel normé réel (resp. complexe) est 
la donnée d'un espace vectoriel E sur R (resp. sur C) 
et d'une norme sur E. Ces espaces sont les espaces métri- 
ques dont les propriétés « ressemblent le plus » à celles 
des espaces numériques habituels. 

VII) La droite numérique achevée 


Désignons par R la droite numérique achevée : 
R = R U {— co} U {- 00}, 


qui est obtenue en adjoignant à l'ensemble R des nom- 
bres réels deux nouveaux éléments que l'on désigne tradi- 
tionnellement par — © et — co, vu le rôle qu'ils jouent 


en analyse. Remarquons que l'application f définie par : 


(= xER 


f (+ ©) 1etf (— ©) — 1 


est une bijection de R sur le segment [— 1, + 1]. On 
peut donc transporter la distance usuelle sur R, en défi- 


nissant une distance sur R par: d’ (x, y) = | (x) —F (y) 


et bien entendu, f est une isométrie de R, muni de cette 
distance d”, sur le segment fermé [—1, — 1] muni de la 
distance habituelle. 

On verra que, dans un espace métrique, on peut traiter 
d'un grand nombre de notions de l'analyse mathématique. 
Pour cela, on a besoin de donner quelques définitions. 

On appelle boule ouverte (resp. fermée) de centre a et 
de rayon r fini > O, dans un espace métrique (E, d), et 
on note B (a,r) (resp. B (a,r)) l'ensemble des points E 
dont la distance à a est inférieure (resp. inférieure ou 
égale) à r. 

Exemples 

1) Considérons dans R? muni de la distance euclidienne 

l'ensemble : B (O,r) = {x e R*:d2 (0, x) < r} (fig. 2,3). 
Pourn=1:B(0,r) ={xeR: 1x] < r}, la boule 

ouverte de centre O et de rayon r n'est autre que l'inter- 

valle ouvert ]J—7r, + r[etona:B (O,r) = [—7r — r]. 


” 


Richard Colin 


Pour n = 2:B (O,r) est le disque de centre O et 
de rayon r sans bord et B (0, r) est le disque avec bord. 


fig. 3 


eat euros 


Pour n = 3 : nous rencontrons avec B (O,r) une 
boule au sens usuel. 
11) Considérons maintenant les boules de centre O 
et de rayon r dans R? muni des distances m et s définies 
précédemment : 
By» (0, r) n’est autre qu'un carré de centre O (fig. 4 a). 
B, (0, r) est le carré ci-dessous (fig. 4 b) : 


Richard Colin 


À À 


fig. 4a fig. 4b 


< Page ci-contre, à droite; 
figure 1 : les courbes 1, 3, 6 
sont topologiquement 
équivalentes parce qu'on 
peut les déformer 
continäment l'une dans 
l'autre; de même pour les 
courbes 2 et 5. 

La courbe 4, par contre, 
n'est topologiquement 
équivalente à aucune des 
autres. 


<« Figure 2. 


« Figure 3. 


Y Figures 4a et 4b. 


I) Dans un ensemble E muni de la métrique discrète, 
une boule fermée de rayon < 1 se réduit à son centre, 
une boule fermée de rayon > 1 est l'espace tout entier. 

Une partie d’un espace métrique est dite bornée si elle 
est contenue dans au moins une boule de rayon fini : 
ainsi R n'est pas borné ; tout ensemble muni de la métrique 
discrète est borné. 

On dit que deux distances d et d’ définies sur un 
même espace métrique sont équivalentes s'il existe deux 
constantes a, b € R telles que : 


d(x y) <ad’(x. y) et d’(x y) < bd (x y) 


pour tous x, YEE. 
On peut constater que les distances d2, m et s définies 
sur R? sont équivalentes puisque : 


m<d<sS< nm. 
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À A gauche, figure 6; 
à droite, figure 5. 


Figure 7. 


Ces inégalités se traduisent par les inclusions : 


B»h (x =) E B;(xr) € Ba (xr) € Bn (x r). 


On a pour n = 2 (fig. 5): 


Bd2 (x, r) 


Bm (x r) 
2 
Bs (x, r) 


Bm (x, r) 
fig. 5 
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Soit (E, d) un espace métrique et Ô une partie de E, 
on dit que Ÿ est un ouvert si, quel que soitxe 0, il existe 
une boule ouverte de centre x contenu dans OÔ (fig. 6). 


Toute boule ouverte B (a, r) d'un espace métrique est 
un ouvert : soit en effet un élément x d'une telle boule, le 
nombre r; = r— d (a, x) est positif; et yeB (x rx), 
ona: 


d'(y,a) < d'(y, x) + d'(x, a) < r:3 + d'(a, x) —r, 
donc B (x, rx) € B (a,r) 


D'après ce qu'on vient de voir, un sous-ensemble de E 
ouvert quand E est muni d'une certaine distance d, l'est 
aussi quand E est muni d'une distance d’ équivalente à à. 

Soit À une partie d'un espace métrique (E, d), on dit 
que A est fermée dans E si son complémentaire dans E 
est un ouvert et on appelle fermeture (ou adhérence) 


de À et on note À le plus petit fermé contenant A. 
Si xE À, on dit que x est adhérent à A. On dit que À 


est dense dans E si A = E. 

On appelle intérieur de À et on note À le plus grand 
ouvert contenu dans A. Si x € À, on dit que x est intérieur 
à À. 


La frontière de A (notée Fr À) est l’ensemble À N [ EA. 

Un espace métrique E est dit séparable s'il est fini ou 
s'il contient une partie dénombrable dense dans lui-même. 
Les espaces topologiques 

Appelonstopologie surunensemble muni d'une métrique 
l'ensemble de ses parties ouvertes; alors, deux métriques 
distinctes sur un même ensemble peuvent ainsi donner lieu 
à la même topologie (on a vu que c'était le cas lorsqu'elles 
sont équivalentes). Beaucoup de notions ou de défini- 
tions ne dépendent pas de la métrique choisie, mais seule- 
ment de la topologie; par exemple, les notions de fermé, 
de fermeture, d'intérieur, de frontière et la notion de limite 
(qui sera définie plus loin) ; on dit que ce sont des notions 
topologiques. Par contre, les notions de boules, d'ensem- 
ble borné, de suites de Cauchy, d'espace complet (ces 
deux dernières notions seront définies plus loin) dépendent 
essentiellement de la distance choisie; elles peuvent être 
altérées si on passe à une distance équivalente; on les 
appelle des notions métriques. 

Les notions et propriétés topologiques ne dépendent 
que des trois propriétés suivantes de la famille des ouverts: 
(01) E et Z sont des ensembles ouverts: 

(O2) toute réunion (finie ou infinie) d'ensembles ouverts 
est un ensemble ouvert; 
(O3) toute intersection finie d'ouverts est un ouvert. 

Ceci suggère de les prendre comme ax/omes d'une 
nouvelle théorie, celle des espaces topologiques, théorie 
généralisant et englobant celle des propriétés topolo- 
giques des espaces métriques. 

On appelle espace topologique E la donnée d'un ensem- 
ble E et d'une famille de parties, appelées parties ouvertes 
de la topologie, vérifiant les trois propriétés (O1), 
(O2) et (O3). | 

Remarque par passage au complémentaire, il 
résulte immédiatement des énoncés (O1), (O2) et (O3) 
trois énoncés (F1), (F2) et (F3) équivalents aux précé- 
dents et concernant les fermés de E : 
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(F1) g et E sont des ensembles fermés; 

(F2) toute intersection (finie ou infinie) de fermés est 
fermée ; 

F(3) toute réunion finie de fermés est fermée. 

Exemples 

— Sur un ensemble quelconque E, prenons pour 
parties ouvertes l'ensemble de toutes les parties de E. 
Cette topologie est dite discrète. Prenons pour parties 
ouvertes l'ensemble des deux seules parties g et E : 
on obtient la topologie grossière. 

— Tout espace métrique définit évidemment un 
espace topologique, si on prend comme ouverts les parties 
que nous avons appelées ouvertes dans l'espace métrique. 
Cette topologie est dite topologie naturelle. 

— Soit E un espace topologique et F une partie de E: 
on peut faire de F un espace topologique, en prenant 
comme ouverts les intersections avec F des ouverts 
de la topologie de E. F est alors appelé sous-espace 
topologique de E, et sa topologie est dite topologie 
induite par celle de E. 

— Si E et F sont deux espaces topologiques, on 
appelle pavé ouvert de EX F tout sous-ensemble de 
la forme U x V où U est un ouvert de E et V un ouvert 
de F. On vérifie facilement que ces ensembles ainsi définis 
sur le produit possèdent tous les axiomes que doivent 
vérifier les ensembles ouverts d’une topologie. Cette 
topologie s'appelle topologie produit. Remarquons que 
la topologie naturelle de R? est la topologie naturelle de R 
par elle-même. 

— Soit E un espace topologique et + une relation 
d'équivalence sur E. Dans l'ensemble quotient E/o, 
on appelle ouverts les ensembles de classes d'équivalence 
tels que leur réunion soit un ouvert de E. Cette topologie 
s'appelle topologie quotient. En particulier, si E est 
R®+1— {0}, c'est-à-dire R7+1 auquel on supprime 
le point O de coordonnées toutes nulles, et si 9 est la rela- 
tion qui associe les points de coordonnées proportion- 
nelles, on définit la topologie de l’espace projectif réel 
à n dimensions Px (R) (voir Géométrie). 

Un espace topologique est dit séparé si, quels que 
soient les points x et y distincts de E, il existe deux ouverts 
d'intersection vide, l’un contenant x et l’autre y (pro- 
priété de séparation de Hausdorff). 

On remarquera que tout espace métrique est séparé : 
en effet, soit les deux boules ouvertes de centre x et y 


d'(x. y). 


et de rayon EN on démontre facilement qu'elles sont 


d'intersection vide (fig. 7). 


Richard Colin 


Cette propriété est très intéressante, car elle permet 
— comme on le verra plus loin — de montrer l’unicité de la 
limite d'une suite dans un tel espace. Les espaces topolo- 
giques non séparés n'ont qu'un usage très limité en 
analyse. 

On dit qu'un espace topologique est métrisable s'il 
existe une métrique qui engendre sa topologie; mais une 
telle métrique n’est pas donnée, car s’il en existe une, il en 
existe une infinité (sauf si E — @) : si une distance d défi- 
nit sa topologie, kd (k€ R:) la définit aussi. 

Un espace topologique métrisable est dit régulier. 
On peut vérifier que la topologie discrète est métrisable, 
une des métriques étant la métrique discrète ; par contre, 
la topologie grossière n’est pas métrisable, car elle n'est 
même pas séparée. 

Soit E un ensemble dans lequel sont définies deux topo- 
logies Ti et T2. On dit que Ti est plus fine ou plus forte que 
T2 si toute partie ouverte pour T2 est aussi ouverte pour T1 
(c'est-à-dire que l'ensemble des ouverts de T1 contient 
l'ensemble des ouverts de T2). La topologie discrète est, 
par exemple, plus fine que toutes les autres topologies 
sur E; la topologie grossière est la moins fine de toutes 
les topologies. 


Voisinages et continuité 

En analyse, une des premières approches de la notion 
de continuité repose sur l'idée qu’une fonction continue f 
d'une variable réelle x doit être telle qu'à de petites varia- 
tions de x correspondent de petites variations de f (x); 
cette condition exprime en fait que le graphe y = f (x) 
doit être, au sens intuitif, une courbe continue. Si on 
conserve un point de vue géométrique, en notant d'abord 
que la fonction f peut être interprétée comme une appli- 
cation de l'axe des x sur l'axe des y, chaque valeur de x 
étant appliquée sur une valeur f (x) de l'axe y déterminée 
de manière unique. On peut alors exprimer la continuité 
de f en x’ en disant que des points suffisamment proches 
de x’ sur l'axe des x sont appliqués par f en des points 
arbitrairement proches f (x’) sur l'axe des y. 

Introduisons maintenant les voisinages pour préciser 
la notion de continuité : on appelle voisinage d'un point a 
d'un espace topologique E toute partie de E contenant 
au moins un ouvert contenant lui-même a. 

Soit (V:);e1 une famille de voisinages de a dans E. 
On dit que c'est un système fondamental de voisinages 
de a si tout voisinage de a contient l'un des V;. On 
démontre le théorème suivant : un espace topologique 
E est séparé si, et seulement si, pour tout 2€E, l'inter- 
section de tous les voisinages fermés de a se réduit à 
{a} (fig. 8). | 

De par sa définition, on voit que la notion de voisinage 
de a est très proche de celle d'ouvert contenant a, avec 
laquelle elle fait souvent double emploi. 

Cette nouvelle notion de voisinage permet d'introduire 
celles de /imite et de continuité. 

Soit E et E’ deux espaces topologiques, À une partie 
de E et a un point de E adhérent à A; on dit, si f est une 
application de À dans FE’, que f (x) tend vers la limite 1 
lorsque x tend vers a par valeurs dans À si, quel que soit 
le voisinage V’ de / dans E”, il existe un voisinage V de a 
dans E tel que : 

FN MA)SE V: 
Exemples 

— Ainsi, si f est une application R dans E’, l'expres- 
sion f (x) tend vers / lorsque x tend vers a par valeur 
supérieure signifie que : quel que soit le voisinage V’ de / 
dans E’, il existe n > O tel que (Ix— al < n,x > a) 
entraîne f (x) € V’. Ici E = R et A = [a, + of. 

— Dans les mêmes conditions, l'expression f (x) 
tend vers / lorsque x tend vers + co, signifie que, quel que 
soit le voisinage V’ de / dans E, il existe « réel tel que x > «x 
entraîne f (x) EV’_. Ici E=R, A=R, a = + oo. 

Soit f une application d'un espace topologique E 
dans un espace topologique E’. On dit que f est continue 
en un point a de E si, quel que soit V’ voisinage de f (a), 
il existe V, voisinage de a, tel que : f (V) € V'; 
ou encore : 

si l'image réciproque par f de tout voisinage de f (a) 
est un voisinage de a; 

ou encore : 

si f (x) tend vers f (a) quand x tend vers a. 

S'il s'agit d'espaces métriques, on peut encore dire : 

si, quel que soit « > ©, il existe n > O tel que 
d (a, x) < n entraîne d (f (a), f (x)) < =; 
ce qui est encore équivalent à : 

si, quel que soit la boule de centre f (a), il existe une 
boule de centre a dont l'image par f appartienne à la pré- 
cédente (fig. 9). 

On démontre aisément que l'application composée de 
deux applications continues est continue. 

Cette notion de continuité est /ocale, car elle ne dépend 
que des voisinages du point considéré. On remarquera 
qu'elle est une généralisation de la continuité telle qu'elle 
était connue pour E = E = R 
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Une application de E dans E’ est dite continue si elle 
est continue en tout point de E. 

Si une application d'un espace topologique E dans un 
espace topologique E’ est continue en un pointa de E, 
elle le reste a fortiori si on remplace la topologie de E 
“ une topologie plus fine, et celle de E’ par une moins 
ine. 

Remarquons que, si (E, d) et (E’, d’) sont des espaces 
métriques et si une application f de E dans E’ est continue 
en un point a de EF, elle le reste si on remplace d et d’ 
par des distances équivalentes. Notons aussi que f est 


1.G.D.A. 


fig. 9 | 
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A Le ruban de Môbius, 
ruban à une seule face, 

dans une interprétation 
artistique de M. C. Escher. 


< A gauche, figure 8 : 
notion de voisinage. 

A droite, figure 9 : 
application continue 

au point a d'un espace E 
dans un espace E. 


M.C.Escher, /e Ruban de Môbius 11 - 1963 - Escher Foundation - 


Haags Gemeentemuseum - The Hague 


Palais de la Découverte - Paris 


À La bouteille de Klein 
imaginée par 

le mathématicien allemand 
Félix Klein en 1882 : 

cette curieuse bouteille, 
dont le col traverse 

la paroï et vient faire 
jonction avec le fond, 

ne comporte ni face interne 
ni face externe. 


Figure 10 : 


la fonction f(x) = 


DIX 


est un exemple de 
fonction contractante. 


toujours continue si E est un espace topologique discret, 
ou si E’ est un espace topologique grossier. 

Dans tout espace métrique (E, d), la fonction distance 
en un point donné a : x = d (a, x), application de E dans 
R:, est partout continue; cela résulte de ce que : 


[d (a, x) — d (a, xo)| < à (x, x). 


On a un théorème important pour les applications 
continues d’un espace topologique E dans un espace topo- 
logique E’ : l’image réciproque par f de tout ouvert de E” 
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est un ouvert de E et l’image réciproque de tout fermé de E’ 
est un fermé de E. Signalons que, par une application 
continue, l'image directe d'un ouvert n'est pas ouverte 
en général. 

Étudions maintenant des applications particulièrement 
importantes en topologie : les homéomorphismes, dont 
on a déjà signalé l'intérêt au début de cette partie. 

On appelle homéomorphisme d'un espace topolo- 
gique E sur un espace topologique E’ toute bijection de E 
sur E’ telle qu'elle-même et sa réciproque soient continues. 

Remarquons qu'il ne faut pas croire que toute appli- 
cation bijective et continue soit nécessairement un homéo- 
morphisme. 

Exemple 

Soit E = [a, b[ U {c} où a,b et ceR et c > b, et 
soit f une application de E dans E’ — [a, b] telle que : 
ft sit£c 
\5 Sit=e 

Cette application est bijective et continue, mais son 
application réciproque n'est pas continue. 

On dit que deux espaces topologiques E et E’ sont 
homéomorphes s'il existe au moins un homéomorphisme 
de l’un sur l’autre. Ces deux espaces ont alors les mêmes 
propriétés topologiques, c'est-à-dire /es mêmes propriétés 
pour tout ce qui concerne les ensembles ouverts, les 
ensembles fermés et les voisinages. 

Exemples 

— L'intérieur d’un disque et l'intérieur d'un triangle 
dans un plan euclidien sont des espaces métriques 
homéomorphes. 

— Le demi-plan y > O, la région y > x? située au- 
dessus de la parabole y — x?, la région y < x? située 
au-dessous de cette parabole, dans le plan R?2, sont 
homéomorphes. 

— La droite réelle, munie de sa métrique naturelle, 
et la droite réelle, munie de sa métrique discrète, ne sont 
pas homéomorphes, puisque, sur cette dernière, toutes les 
parties sont ouvertes et qu'il n’en est pas de même sur la 
première. 


— On peut vérifier que l'application f de R dans 


f (t) = 


[— 1, +1] qui à xeR fait correspondre TT 
est un homéomorphisme, donc R et [— 1, + 1] sont 
homéomorphes. 

Notons que les homéomorphismes d'un espace sur 
lui-même forment un groupe et, dans une classe d'espa- 
ces, la relation : « il existe un homéomorphisme entre E 
et E’ », est une relation d'équivalence. 

Toutesles notions précédentes de continuité et d'homéo- 
morphie sont topologiques. Il est utile d'avoir une notion 
de continuité plus forte, qui n'est plus seulement topo- 
logique, utilisant le fait qu'on peut « comparer » les voisi- 
nages de deux points distincts d’un espace métrique grâce 
aux rayons des boules. Plus précisément, on dira qu'une 
application f : (E, d) — (E’, d’) est uniformément conti- 
nue si : 

quel que soit s > O, il existe n > 0, tel que : 
d (x, y) < n entraîne d’ (f(x), f (y)) < =; 
ou encore : 

quel que soit s > 0, il existe n > 0, tel que : 
B (x) « f-1(B (f(x), s<)) quel que soit xEeE. 

Par exemple, sur la droite réelle, la fonction x est uni- 
formément continue, mais la fonction x? ne l'est pas; 
en effet, on a: 

[+ hP— x) = |/2hx+ |] >2hx sih>0,x>0; 
alors pour = donné, si on cherche h tel qu'on ait: 


[2 hx+ 2] < €, 
on doit nécessairement prendre |h| < 


2/x| 
suite impossible de choisir x indépendant de x. 

De même (x, y) — xy n’est pas une application unifor- 
mément continue de R? dans R. 

Un cas particulier de cette situation est fourni par les 
applications /ipschitziennes : on dit qu'une application 
f:(E,d) = (E’, d’) estlipschitzienne de rapport k (K€ R:) 
siona: 

d' (f(x), f (y)) < kd (x y) quels que soient x, Y EE; 
ainsi, l’image réciproque par f de la boule de centre f (x) 
et de rayon r contient la boule de centre x et de rayon r/k. 
Si k = 1, on a une isométrie ; si k < 1, on dit que l’appli- 
cation est contractante (fig. 10). 


et il est par 


Par exemple, l'application de R?dans R2quià x = (x1, x2) 
x 


1 
L . est contractante de rapport 3- 


; x 
fait correspondre (or 2 


Limites de suites — Espaces métriques complets 


Soit E un espace topologique. Soit Xo, X1, …… Xn, 
une suite de points de E. C'est une application de l'en- 
semble des entiers N dans E. On dit que la suite (xx) 
converge vers un point | de E si, quel que soit le voisinage 
V de / il existe un entier ro tel que, pour n > no, tous les xx 
appartiennent à V. 

Dans le cas où E est un espace métrique, on a encore : 
une suite (xx) de (E, d) converge vers un point/de E 
ou a pour limite / si la suite des nombres réels : d (/, xo), 
d (I, x1), … d (I Xn), …, converge vers 0; 
ou encore : 
quel que soit s > O, il existe un entier no tel que, pour 
tout nr > monait: d(/ Xn) < =. 

Remarques 

— Siune suite est convergente dans un espace topo- 
logique E, elle l'est a fortiori si on remplace la topologie 
de E par une topologie moins fine. 

— Si une suite d'un espace topologique E admet 
une limite et si E est séparé, cette limite est nécessaire- 
ment unique. On en déduit qu'étant donné qu'un espace 
métrique est toujours séparé, si une suite d'un tel espace 
admet une limite, cette limite est unique. 

— On appelle suite extraite de la suite (xx) toute 
suite de la forme k — xn,, où k — n; est une suite stric- 


tement croissante d'entiers > 0. Si (xx) converge vers x, 
toute suite extraite de (x) converge vers x, la réciproque 
n'étant pas vraie. 

— Pour qu'une application f d'un espace topolo- 
gique E dans un espace topologique E’ soit continue en 
un point x de E, il faut que l’image par f de toute suite 
de points de E convergeant vers x soit une suite de 
points de E’ convergeant vers f (x). Si E est métrisable, 
la condition est également suffisante. 

— Pour qu'un point x d'un espace topologique E 
soit adhérent à une partie À de E, il suffit qu'il existe 
une suite d'éléments de À qui converge vers x. Si E 
est métrisable, cette condition est également nécessaire. 


Ainsi, si E est métrisable, l’adhérence A d'une partie A 
de E est l’ensemble des limites des suites de A qui sont 
convergentes dans E. On en déduit immédiatement que, 
pour qu'une partie d'un espace topologique métrisable E 
soit fermée, il faut et il suffit qu’elle contienne toutes les 
limites de ses suites convergentes dans E. 

Donnons une nouvelle définition importante : soit (E, d) 
un espace métrique. Une suite (x) dans E est appelée 
suite de Cauchy si: 

quel que soit « > O, il existe p € N tel que : pour tout 
n > pettout m > p,on ait: d (Xn, Xm) < €; 
ou encore : 

d (Xm: Xn) tend vers O0 quand n et m tendent vers + 00. 
On démontre facilement que toute suite de Cauchy est 
bornée. 

On démontre aussi que, si une suite (x) a une limite x, 
alors (xx) est de Cauchy. En effet, soit p € N tel que si 


n > p,on ait d (x Xn) < 3: alors, ss n>petm>p, 


on a: 
d'(Xn: Xm) < d (Xn, X) + d'(X, Xm) < €. 


Mais, la réciproque de cette propriété n'est pas vraie 
en général, d'où la définition : un espace métrique E est 
dit complet si toute suite de Cauchy d'éléments de E a 
une limite dans E. 

L'avantage de tels espaces est qu'on peut y montrer 
l'existence d'une limite sans connaître explicitement 
cette limite, procédé essentiel en analyse. 

Exemples 
— L'espace métrique E = [0, 1[ pour la distance 


ne . NN: 1 
euclidienne n'est pas complet, car la suite (en = 1 —;| 
est de Cauchy, mais n’a pas de limite dans E. 

— Considérons la suite des entiers naturels 
Xn= n; elle n'est manifestement pas de Cauchy pour la dis- 
tance naturelle de R, mais elle est une suite de Cauchy pour 


la d’ déjà définie puisqu'elle converge vers + 00 dans R: 


X y 
1+ xl 1+ /yll 

Un espace vectoriel normé complet est appelé espace 
de Banach. Ces espaces seront utilisés en analyse fonc- 
tionnelle. 

Si E est un espace métrique et F un sous-espace métri- 
que de E, alors : si F est complet. F est fermé dans E, 
et si E est complet et F fermé dans E, F est complet. 

On démontre que R muni de sa métrique naturelle est 
un espace métrique complet. Ce résultat est très impor- 
tant en analyse et permet de déduire que : 

— tout intervalle fermé de R est complet; 

— tout espace métrique produit de deux espaces 
complets étant complet, R?* est complet pour la métrique 
euclidienne ainsi que pour toutes les métriques qui lui 
sont équivalentes. 


d'xn=. 


Espaces compacts 


Si E est un espace topologique et {U;, ; e l} une famille 
de parties de E, on dit que cette famille recouvre E si 
E= LU VU: 
iel 

Un espace topologique E est dit compact s'il est séparé 
et si, de tout recouvrement de E par une famille d'ouverts 
O;,:el, de E, on peut en extraire un recouvrement fini 
(c'est-à-dire qu'il existe une partie finie F de | telle que : 

E= U 0). 
ieF 

On peut montrer par passage au complémentaire que 
cette dernière propriété est équivalente à la suivante : 
si une famille de fermés de E est d'intersection vide, alors 
il en existe une sous-famille dont l'intersection est déjà 
vide. 

Remarques 

— On en déduit immédiatement que, si E est un 
espace métrique compact, alors E est borné (il suffit 
de considérer un recouvrement de E par des boules 
ouvertes de même rayon). 

— L'ensemble desintervalles ouverts ]n — 1,n + 1], 
n € Z, est un recouvrement ouvert de R; il n’a pas d'autre 
sous-recouvrement que lui-même, car, si on supprime 
l'intervalle ]1n — 1, n + 1[, le point » n'est plus recou- 
vert. Ceci prouve que R n'est pas compact. 

— Si E est un espace topologique séparé et À une 
partie de E, alors : si À est compacte, À est fermée dans E, 
et si E est compact et À fermée dans E, A est compacte. 

— Une réunion fine de parties compactes d'un 
espace topologique E séparé est une partie compacte 
de E. 

Énoncçons l'important théorème de Borel-Lebesque : 
pour qu'une partie À de R soit compacte, il faut et il 
suffit qu'elle soit fermée et bornée dans R. 
Conséquences 

— Le même raisonnement où on remplace les inter- 
valles par des hypercubes prouve que /es parties compac- 
tes de R? sont exactement les parties fermées et bornées 
de R?. 

— Ona vu que la droite achevée R est homéomorphe 
à l'intervalle [— 1, 1]. Il s'ensuit que R est compact, 
ainsi que R?. 

Étudions maintenant l'importance de la 
compacité pour les applications continues. 

Si E et E’ sont deux espaces topologiques séparés 
et f une application continue de E dans FE”, alors l'image 
f (K) de toute partie compacte K de E est compacte. 
Il s'ensuit que, si E est un espace compact, E’ un espace 
topologique séparé et f une application injective et conti- 
nue de E dans E’, alors f est un homéomorphisme de E 
sur f (E). 

On en déduit des propriétés intéressantes en analyse 
pour les applications continues à valeurs réelles. 

— Si E est un espace compact et / une application 
continue de E dans R, alors f est bornée et atteint ses 
bornes, c'est-à-dire qu'il existe 2€ E et b£€E tels que, 
quel que soitxeE,onait:f (a) < f (x) < f (b); 

En effet, f (E) est une partie fermée et bornée de R. 
Les nombres réels sup f (x) et inf f (x) sont limites de 

<eE Xe 
suites d'éléments de f (E), donc appartiennent à f (E), 
car f (E) est fermé. 


notion de 
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» Le mathématicien français 
Émile Picard (7856-1941) 

à qui l'on doit, entre autres, 
une importante méthode 
de calcul des solutions 
d'équations par approxi- 
mations successives : 

cette méthode est connue 
sous le nom de théorème 

du point fixe. 


ngue - Viollet 


— Si E est un espace compact et / une application 
continue de E dans R telle que f (x) > O pourtoutx€E, 
alorsilexiste nm > Otelque,pourtoutxeE,on aitf (x) > m. 
En effet, puisque m = inf f(x) ef (E),on am > OC. 

xeE 


Si E est un espace compact et si (E’, d’) est un espace 
métrique, alors toute application continue de E dans E’ 
est bornée. En effet, quel que soita € E, x = d (a, f (x)) 
est continue, donc bornée. 

Théorème de Heine si (E, d) est un espace 
métrique compact, (E”, d’) un espace métrique et f une 
application continue de E dans E”, alors f est uniformé- 
ment continue. 

Soit une suite (xx) d'éléments d'un espace topolo- 
gique E; on dit que a est point adhérent à la suite si, 
pour tout voisinage V de a, il existe une infinité de valeurs 
de l'entier n telles que x, € V. Si une suite converge vers a, 
elle admet a comme point adhérent. 

Énonçons une condition nécessaire et suffisante pour 
qu'un espace métrisable soit compact. 

Théorème de Bolzano-Weierstrass si E est 
un espace métrisable, pour qu'il soit compact, il faut et il 
suffit que toute suite d'éléments de E admette au moins 
un point adhérent (ou que de toute suite, on puisse 
extraire une sous-suite convergente). 

Donnons sa conséquence immédiate : si E est un espace 
métrique compact, alors E est complet. Réciproquement, 
on montre qu'un espace métrique complet E est compact 
si et seulement s'il vérifie la propriété suivante de pré- 
compacité : pour tout £ > O, il existe un recouvrement 
fini de E par des boules de rayon &. 

Un autre théorème important, qui sera utilisé en 
analyse fonctionnelle, est le théorème de Tychonoff : 
tout produit, fini ou non, d'espaces compacts est compact. 
Inversement, si un produit d'espaces non vides est 
compact, chacun d'eux est compact. 

La démonstration de ce théorème repose sur la théorie 
des filtres, qui, bien que de plus en plus importante et 
utilisée, n'a pas été abordée dans cet exposé par souci 
de simplicité. 

La notion de compacité est très forte; il suffit souvent 
d'avoir à sa disposition des espaces localement compacts 
qui sont d'un usage constant en analyse : on dit qu'un 
espace topologique E est localement compact s'il est 
séparé et si chacun de ses points possède au moins un 
voisinage compact. 

Remarques 
— Tout espace métrique dont les boules fermées sont 
compactes est localement compact. Il s'ensuit que R7 est 
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localement compact. Mais on doit bien noter qu'un espace 
métrique peut être localement compact (notion purement 
topologique) sans que ses boules fermées soient forcé- 
ment compactes. On se convaincra de l'importance des 
espaces localement compacts en remarquant que tous les 
espaces de la géométrie : R, R?, surfaces, courbes, sont 
localement compacts. 

— Tout espace compact est évidemment localement 
compact; tout espace topologique discret est localement 
compact. 

— Si E est un espace localement compact et si A 
est une partie ouverte (resp. fermée) de E, alors le sous- 
espace topologique A de E est localement compact. 

Application : critères de non-homéomorphisme 
La compacité et la locale compacité étant invariantes 
par homéomorphismes, on peut montrer que deux espaces 
topologiques ne sont pas homéomorphes, parce qu'un 
de ces espaces est compact ou localement compact et 
que l'autre ne l'est pas. Par exemple, les intervalles 
[0, 1] et [0, 1[ ne sont pas homéomorphes, parce que le 
premier est compact et que le second ne l'est pas. Un 
espace vectoriel de dimension finie estlocalementcompact, 
par contre un espace vectoriel de dimension infinie ne 
l'est pas (voir le théorème de F. Riesz dans le chapitre 
Analyse) ; donc ils ne sont pas homéomorphes. Naturel- 
lement, ces critères sont très élémentaires, et la plupart 
des cas de non-homéomorphisme leur échappent. Par 
exemple, les deux espaces [0, 1[, 10, 1[ sont tous deux 
localement compacts mais on démontre qu'ils ne sont 
pas homéomorphes. Deux espaces vectoriels normés de 
dimensions finies différentes sont tous deux localement 
compacts, mais ne sont pas homéomorphes (la démons- 
tration est difficile). 


La méthode des approximations successives 


On doit à É. Picard une méthode de construction de 
solution d'équations par approximations successives 
formulée sous le nom de théorème du point fixe. 

Pour le théorème des fonctions implicites et le théo- 
rème d'existence de la solution d'une équation différen- 
tielle, le théorème du point fixe est l'outil indispensable. 
Il est donc un des principaux théorèmes d'existence en 
mathématiques. 

Théorème du point fixe : soit E Un espace métrique 
complet et f une application contractante de E dans lui- 
même, c'est-à-dire qu'il existe une constante k, O0 < k < 1, 
telle que : d'(f (x), f (y)) < kd (x, y) quels que soient 
x et y dans E. Alors l'équation f (x) — x a une solution 
unique dans E. De plus, quel que soit x € E, la suite (xx) 
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définie par récurrence par x1 = f (X0), .…., Xn +1 = f (Xn), … 
converge vers cette solution. 

La démonstration est très simple, et on voit clairement 
le rôle joué par les suites de Cauchy. Remarquons d'abord 
que l’unicité est évidente : si f (x) = xetf (y) = y,ona: 
d'(f(x,F(y)) = d (x y) < kd (x y), ce qui entraîne : 
d (x, y) = 0. Il suffit donc de montrer que (Xn) est 
convergente, car, si sa limite est x, on obtient x = f (x) 
en faisant tendre n vers l'infini dans la relation de récur- 
rence Xn +1 = f (Xr), puisque f est continue. 

Or,ona: 


d (Xp +1 Xp) = d (f (Xp), F (Xp +1)) < kd (Xp, Xp -1), 
d'où, par récurrence sur p: 
d'(Xp+1, Xp) < K?d (x1, Xo) ; 


par inégalité triangulaire, on a pour q > p: 


g-1 g=-1 
d (Xp: Xa) < > d'(Xr+1, Xr) < G «) d (x1, Xo) : 
r=p r=p / 


ce qui entraîne que : 
k? 
d'(Xa Xp) < per (x, Xo) ; 


cette dernière expression tend vers O quand p tend vers 
+ co. La suite (x.) est donc de Cauchy et admet une 
limite x, puisque E est complet. 

Remarquons que, si on fait tendre q vers l'infini dans 
l'inégalité précédente, on obtient : 


Kk2 
d'(Xa Xp) < 1 (x, Xo) ; 


ce qui précise la rapidité de convergence de la suite (x) 
vers X. 
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ANALYSE 


Le terme « analyse » est, pour tout utilisateur des mathé- 
matiques, pris au sens d'analyse infinitésimale; c'est-à- 
dire que d'emblée il pose les problèmes du continu, de 
l'infini et donc de limite. On dit souvent que l'analyse 
commence où l'algèbre s'arrête; cette image n'oublie 
certainement pas que le continu prend naissance avec la 
construction du corps des nombres réels R (Dedekind, 
Weierstrass et Heine-Canter) par sa propriété d'inextensi- 
bilité, de telle sorte que R se construit par des procédés de 
passage à la limite, tandis que Q ou Z (voir /es Nombres) 
sont envisagés comme des constructions algébriques 
stables : anneaux, corps. L'utilisation de la topologie 
permet de préciser davantage ce point. 

C'est donc bien par souci de distinction avec la synthèse 
algébrique que s'est développée l'analyse en mathéma- 
tiques, à partir de la notion de continu telle que la méca- 
nique, par exemple, avec l'idée de mouvement, de vitesse, 
d'accélération, la fournit. 

Malgré l'extension du calcul infinitésimal depuis 
le XVIIe siècle, ce n’est qu'à la fin du XIXE siècle avec les 
travaux de Georg Cantor (1845-1918) que les concepts 
pourront être délimités formellement tant pour le continu 
que pour l'infini. Le développement de la topologie 
(Riemann, Fréchet) donnera alors un cadre global à 
l'analyse mathématique classique. 

La démarche du mathématicien tendant à plus de géné- 
ralité en se posant la question de l'approximation linéaire 
des fonctions conduisit à construire le calcul différentiel 
sur les espaces de Banach, puis la géométrie différentielle 
— généralisant à plus de trois dimensions l'idée de 
Descartes — et aboutit à ce pseudo-paradoxe qu'est 
l'algébrisation de l'analyse, que l’on retrouve par exemple 
dans les théories modernes de la mesure (où l'on fait 
une harmonieuse synthèse de l'analyse et de l'algèbre 
par l'intermédiaire de la notion de dualité). 

Au cœur de toute l'analyse mathématique se trouve la 
notion de correspondance « fonctionnelle » : pour l'évo- 
lution des grands courants d'idées mathématiques, c'est là 
une des plus fructueuses sources, et l'on peut encore y 
voir un lien étroit entre l'algèbre et la mathématique du 
continu. Cette interpénétration des domaines est encore 
affirmée par la théorie analytique des nombres premiers, 
ou bien d’autres travaux récents. 


Analyse classique 


Variables et fonctions 


Dans cette première partie, on va dresser un cadre géné- 
ral de l'analyse classique. On ne considère que des 
nombres réels, laissant le cas complexe pour un dévelop- 
pement ultérieur. Les concepts seront dégagés dans leur 
sens le plus élémentaire afin de montrer la nécessité de 
généralisations. 

Une grandeur variable, ou plus simplement une variable, 
est une grandeur susceptible de prendre plusieurs valeurs; 
une grandeur constante, ou encore une constante, garde 
en revanche une valeur donnée. Selon les conditions 
du problème posé, une même grandeur peut être soit 
variable, soit constante : par exemple, au cours de l'étude 
d'un phénomène physique, la température d'ébullition 
de l’eau est une constante dès que toutes les conditions 
sont spécifiées, mais elle devient une variable si l'on fait 
varier la pression ambiante. 

C'est au mathématicien allemand Bernhardt Rie- 
mann (1826-1866) que l'on doit la définition claire 
d'une fonction : « Le nombre y est fonction du nombre x 
qui varie dans un champ donné G si, à tout nombre x 
situé dans D, correspond par une loi déterminée mais de 
nature et d'expression absolument quelconque un nom- 
bre y et un seul; x est appelé la variable indépendante. » 
Sa définition fait écho à celle de son compatriote 
Gustav Dirichlet (1805-1859) : « On dit que y est une 
fonction de x si, lorsqu'on se fixe une certaine valeur 
de x quelconque choisie dans un certain ensemble, on 
en déduit une valeur de y et une seule. » 

Il s’agit là d'un tournant dans le développement de 
l'analyse mathématique prise en tant qu'étude des modes 
de variation simultanée de nombres liés entre eux. En 
effet, jusqu'au XVIIIe siècle, on a pu se contenter d'une 
certaine notion de fonction, très ambiguë, car non séparée 
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pour la première fois 
en 1748. 


> Page ci-contre 

en haut à gauche, figure 3 : 
représentation graphique 
correspondant 

à deux fonctions distinctes. 
En haut à droite, figure 6: 


a, la fonction 
y = Arc cos NT—E 
est définie et continue 
pourtel—1, +71]; 

0 si x=0 


v= | 
+1 si x>0 
présente une discontinuité 
de première espèce 
en x = 0; 


b, la fonction 
—1 si x <0 


2: 01 
c, la fonction y = sin e 


présente une discontinuité 
de seconde espèce en 
x = 0; 


T 


d, la fonction y = cos & 


est définie et continue 

pour tout x € 0; 

on ne peut pas prolonger 
par continuité cette fonction 
en x = 0. 


» Figure 2: 
graphique de la fonction 
définie par 


y = 3x pour x < 2, 

y= xpourx> 2. 

» Figure 1 : 

graphique de Ia fonction 
y = 4x —2 + — x 
pour2<x< 7. 
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d'un contexte analytique et incluant la continuité; mais 
après Leonhard Euler (1707-1783), dès les travaux de 
Jean-Baptiste-Joseph Fourier (1768-1830), et surtout 
ceux d'Augustin-Louis Cauchy (1789-1857), il devint 
nécessaire de donner une définition intrinsèque à la 
notion de correspondance fonctionnelle. 

Par le tableau suivant, on a cherché à exprimer la dépen- 
dance entre la température T d'ébullition de l'eau et la 
pression atmosphérique p : 


300 400 500 600 700 


p (mm de mercure) 


T (°C) 75,8 83,0 88,7 93,5 97,7 


Sur la première ligne sont reportées diverses valeurs 
de la pression et, sur la seconde — en regard sur chaque 
colonne — les valeurs correspondantes de la température. 
On peut donc dire que la température T est fonction de 
la pression p; il est nécessaire, toutefois, d'ajouter quel- 
ques observations. Tout d'abord, on note que le tableau 
ne contient pas toutes les valeurs numériques que peut 
prendre la grandeur « pression ». En second lieu, on voit 
qu'à chaque valeur de la température, correspond une 
valeur bien déterminée de la pression ; on peut ainsi penser 
qu'il est possible d'échanger les rôles des deux lignes du 


tableau et de considérer la pression atmosphérique comme 
étant fonction de la température d’ébullition de l’eau. 

Notons encore que, parmi les cas tabulés, la valeur 
de la température T — — 300 °C ne correspond à aucune 
valeur de la pression, non parce que, sur cette table, on 
ne peut lire la valeur — 300 °C, mais parce qu'une telle 
valeur de température n'est physiquement pas admissible 
(le zéro absolu étant proche de — 273 °C). Ceci éclaire 
le sens de l'expression « choisie dans un certain ensemble » 
utilisée dans la définition de G. Dirichlet pour le choix 
d'une valeur de la variable indépendante. 

Définir une fonction signifie donc se donner la possibilité 
de connaître les valeurs prises par la variable qui dépend 
— selon une certaine correspondance — des valeurs 
prises par une autre variable, indépendante; cela peut se 
faire par un tableau (la spécification n’est alors que par- 
tielle), ou par un graphique en considérant les deux varia- 
bles comme les coordonnées cartésiennes d'un point 
du plan (l'avantage est alors d'obtenir une idée globale 
du comportement de la fonction donnée), soit encore 
analytiquement, quand cela est possible, lorsque la fonc- 
tion peut admettre une ou plusieurs « formules » (fig. 1 
et 2). 

Le domaine de définition d'une fonction définie par une 
ou plusieurs « formules » est l'ensemble des valeurs de la 
variable dépendante pour lesquelles ces « formules » 
ont un sens. Ainsi, la somme des angles internes d'un 
polygone est fonction du nombre de côtés; elle est donc 
définie seulement pour des valeurs entières et positives 
de la variable dépendante. La « formule » 

y=\x—2+ 7x 
n'a de sens (dans le champ réel) que pour 2 < x < 7; 
le domaine de définition de cette fonction est donc l'inter- 
valle fermé [2, 7]. 

On distingue souvent les fonctions algébriques, qui 
se calculent par des opérations rationnelles et des extrac- 
tions de racines, et les fonctions transcendantes, qui 
sont les fonctions analytiques non algébriques; parmi ces 
dernières, on peut citer les fonctions exponentielle, 
logarithme, trigonométriques directes, et bien d'autres 
encore. Cette classification n'est, bien sûr, pas exhaustive, 
et de nombreuses fonctions ne rentrent pas dans le 
cadre des fonctions analytiques, ainsi la fonction indi- 
catrice des nombres irrationnels : 


six é Q 
|y=0 sixeQ 
Par la représentation graphique des fonctions, on peut 


[y=1 


faire ressortir une propriété de définition : le graphe d'une 
fonction n'est coupé par une parallèle quelconque à l'axe 
des ordonnées Oy qu'en, au plus, un point. La figure 3 
montre ainsi que la courbe tracée correspond à autant de 
fonctions distinctes que d'arcs possédant la propriété 
ci-dessus, c'est-à-dire deux. 

Ce sont les propriétés des nombres réels que l'on 
retrouve dans les caractéristiques de variation des fonc- 
tions : structure d'ordre, bornes d'intervalles, que l'on 
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traduit en termes de croissance et d'extrema. Dans ce 
qui suit, on notera f (x) le nombre associé à la variable x 
par la correspondance ou fonction x+= f (x). 

On dit qu'une fonction est croissante sur un domaine D, 
inclus dans le domaine de définition, si : 


VxeD,xeD,x1< x2 = f (x) < f(x). 
Elle est dite décroissante sur D si: 
VxeD,xeD,x1< x2 = f(x1) > f (x). 


Elle est dite monotone sur D si elle est croissante ou 
décroissante sur D (fig. 4). 

On dit qu'une fonction est paire si f (x) = f (— x) 
pour tout xe D, et qu'elle est émpaire si f (x) = —f (— x) 
pour tout x € D (fig.5). La représentation graphique admet 
dans le premier cas Oy pour axe de symétrie, dans le 
second cas l'origine O pour centre de symétrie. 


La notion de continuité 


La topologie induite sur un ensemble par une métrique 
a permis de définir avec une grande netteté l'idée de /imite 
et celle de continuité d'une fonction. 

On dit que la fonction définie sur l’ensemble E € R 
admet la /imite L lorsque x tend vers a si, à tout nombre 
£ > O aussi petit qu'on le désire, on peut associer un 
nombre n — dépendant de : —tel que, lorsque |x—a| < n 
etxeE, alors|f(x)—L| < «,ce quel'onécritlimf(x) = L. 
En particulier, la fonction est continue au point a€E 
si L existe et est égal à f (a). On appelle points de dis- 
continuité de la fonction les points du domaine de défi- 
nition en lesquels elle n’est pas continue. Ceux-ci sont 
de trois types : 

tout d'abord les points à discontinuité éliminable, 
par exemple l'origine pour la fonction définie par : 
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y=2 six=0 


y=sinx six 0 et 


puisqu'il suffit de changer la valeur en x = 0 en posant 
y = 0 pour obtenir la continuité; 

ensuite les points de discontinuité de première espèce 
pour lesquels existent une limite à droite L, une limite à 
gauche L’, et tels que la valeur en ces points soit égale à 


3 (L + L’); par exemple, la fonction définie par 


six 0 et y=0 six = 0; 


x 15 


enfin, les points de discontinuité de seconde espèce, 

tels que, soit la limite à gauche, soit la limite à droite, 
soit les deux, n'existent pas ou bien soient infinies (fig. 6). 
On peut rappeler qu'une condition nécessaire et suffi- 
sante pour que la fonction strictement monotone 


x+H f (x) définie sur l'intervalle [a, b] soit continue sur 
cet intervalle, est que cette fonction prenne toutes les 
valeurs comprises entre f (a) et f (b). Ceci permet entre 
autres de définir les fonctions réciproques des fonctions 
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fig. 6 


Y A gauche, figure 4 : 
en haut, graphiques 

de la fonction y = a: 
1,poura > 1; 
2,pour0<a< 1; 

en bas, graphiques 

de la fonction 

y = 10ga (x) : 

3, poura > 1; 

4, pour0<a< 1. 

Les graphiques 1 et 2 
sont ceux des fonctions 
croissantes, alors que 
les graphiques 3 et 4 
sont ceux de fonctions 
décroissantes. 

À droite, figure 5 : 

a, un exemple de 
fonction paire, y = cos x; 
b, un autre exemple 

de fonction paire, 
y=3x2—1; 

c, un exemple de fonction 
impaire, y = sin x. 


1.G.D.A. 


1.G.D.A. 


À À gauche, figure 7 : 

a, graphique de la fonction 
y = Arc sin X; 

b, celui de la fonction 

y = Arc cos X; 

c, celui de ja fonction 

y = Arc tg X. 

A droite, figure 9 
représentant une fonction 
croissante et une fonction 
décroissante : 

a, la croissance est plus forte 
en M qu'en M 

cartg8> tg«; 

b, la décroissance 

est plus forte 

en M qu'en M 

cartgax> tg£. 


» Figure 8 : 
graphique de la fonction 
yÿ = Zx(x=1) continue 


sur ]0, 7], 
mais non bornée. 


usuelles continues et strictement monotones sur un 
intervalle (fig. 7). 

Citons parmi les principales propriétés des fonctions 
continues sur un intervalle | fermé borné de R : 

a — toute fonction réelle continue dans | est bornée 
dans |; 

b — toute fonction réelle continue dans | possède 
un minimum et un maximum dans |, qui sont effective- 
ment atteints par la fonction; 

c — une fonction continue dans | ne peut y changer de 
signe que si elle s'y annule; 

d — toute fonction réelle, continue dans |, y est 
uniformément continue, c'est-à-dire que, pour tout 
s > O, il existe n > 0, ne dépendant que de 2, tel que, 
si x’ et x” sont des points de | tels que |x’— x”| < n, 
alors lf (x) —f (x”)| < =. 
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Les propriétés a, b et d ne sont plus vraies dès que | 
n'est pas fermé ou n'est pas borné (fig. 8). 


Dérivées et primitives 


L'idée même de la dérivée d’une fonction est très cou- 
ramment répandue, puisque c'est en fait celle de vitesse 
d'un mouvement, ou bien celle de pente d'une route, 
ou même encore celle de moyenne. C'est une considé- 
ration géométrique qui a permis de développer ce point, 
et par là même, de construire l'analyse mathématique; 
on doit cette étape fondamentale au génial mathémati- 
cien allemand Gottfried Wilhelm Leibniz (1646-1716). 

Sur une courbe L' parcourue par un mobile M (ou 
décrite par un point M) dans le sens des abscisses crois- 
santes, on montera ou l’on descendra, aux alentours 
d’un point Mo, si la fonction représentée par T° est crois- 
sante ou décroissante, et l'on constatera aisément que ce 
phénomène de montée ou de descente est d'autant plus 
accentué que la pente de la tangente T° en Mo est élevée 
en valeur absolue (fig. 9). De là vient donc l'idée de 
considérer non plus les cordes joignant deux points de I}, 
mais la tangente au point fixe, dont la pente sera la limite 
— lorsqu'elle existe — de la pente de la corde MoM lorsque 
M tend vers Mo (fig. 10). 


On appellera donc dérivée de la fonction xt f (x) 
: — f — f 

au point xo la limite éventuelle du rapport = 
— X0 


lorsque x tend vers xo, ce qui correspond bien à la notion 
usuelle de vitesse instantanée par rapport à celle de vitesse 
moyenne. Si cette limite existe, on dit que la fonction 
est dérivable en x: on note f”’ (xo) la valeur de celle-ci, 


ou encore sh (xo) 
ax 9” 
On montre que toute fonction dérivable est continue. 
La réciproque est inexacte : le mathématicien allemand 
Karl Weierstrass (1815-1897) a par exemple montré que 


Lee] 
la fonction définie par: 2. a?cos 7 b? x était continue et 
n=0 
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non dérivable, siO < a < 1ethbe Ntelqueab > che + 1. 

Lorsqu'une fonction x+= f (x) admet une dérivée (ou 
est dérivable) en tout point d’un domaine D, on peut donc 
associer à tout point x € D le nombre f’ (x) et définir ainsi 
une nouvelle fonction dite fonction dérivée x+ f” (x). 

L'opération qui consiste, partant d'une fonction 
donnée f (x), à en déduire la fonction dérivée f” (x), 
s'appelle donc la dérivation, et le tableau 11 résume les 
résultats les plus notables. Cette opération peut être répétée 
à nouveau, en partant de la fonction f” (x); on obtient 
ainsi la fonction dérivée seconde x f" (x), puis la 
fonction dérivée troisième, et ainsi de suite; la dérivée 
n-ième fn) (x) étant donc la dérivée de la dérivée d'ordre 
(n—1), fm D (x). 

La dérivation des fonctions fait partie de la classe des 
outils fondamentaux de l'analyse mathématique, car elle 
va permettre de définir une méthode générale pour 
étudier localement (au voisinage d’un point) le compor- 
tement d'une fonction en la remplaçant — lorsque cela 
est nécessaire — par une fonction plus simple. 

On a vu dans les considérations géométriques qui 
introduisaient l'idée de dérivée que, plus une fonction 
croissait ou décroissait, plus la pente de la tangente au 
graphe était élevée en valeur absolue. D'autre part, il 
est clair que cette pente est négative si la fonction décroît, 
positive si elle croît. On peut donc se poser la question 
de savoir ce qui se passe pour un extremum — minimum 
ou maximum — c'est-à-dire en un point où l'on passe 
d'un sens de variation à l'autre (il s'agit d'extrema rela- 
tifs) ; on retrouve alors que la dérivée est nulle en un tel 
point et change de signe. 

Le théorème de Rolle ne fait que préciser ceci en 
disant qu’une fonction continue sur un intervalle fermé 
[a, b], et dérivable sur ]a, b[, telle que f (a) = f (b), 
admet nécessairement un extremum (au moins) dans 
[a, b] (fig. 12) : en effet, partant du point (a,f (a)) 
en croissant, pour revenir à la même hauteur il faudra 
« descendre » à un moment donné; de même, si l'on 
décroît à partir de (a,f (a)), il faudra « remonter ». 
Si la corde qui joint les extrémités du graphe représentant 
x+H f (x) sur [a, b] est horizontale, il en sera donc de 
même de la tangente au graphe en un point (au moins). 

C'est cette présentation qui permet de voir que le 
théorème des accroissements finis est la générali- 
sation du théorème de Rolle : si f (x) est continu sur 
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[a, b], et dérivable sur ]a, b[, alors il existe un point 
ce ]a, b[ tel que f(b)—f(a) = (b—3a) f'(c). En 
d'autres termes, il existe un point c où la tangente est 
parallèle à la corde joignant (a,f (a)) et (b,f(b)) 
f (b)—f (a) 

b—a 
fit d'appliquer le théorème de Rolle à la fonction 
f (b)—f (a) 

b— a 
qui est telle que F (b) = F (a) = 0, et l'on a donc un 
point ce Ja, b[ où F’ (c) — 0, or 
f(b)—f (a) 

b— a 

Lorsqu'on écrit la formule des accroissements finis sous 
la forme f (b) = f (a) + (b— a) f’(c), on voit appa- 
raître l’idée qui est exprimée par la formule de Taylor 
(Brook Taylor, 1685-1731, mathématicien anglais), qui 
consiste à approcher les valeurs d'une fonction autour 
d'un point a par un polynôme selon les puissances de la 
différence (x — a) ; en effet, dans la formule des accrois- 


sements finis, en supposant la dérivée continue et b très 
voisin de a, alors f’(b) est très voisin de f” (a) : 


f'(b) = F’(a) + (b— a), 
où € tend vers 0 lorsque b — a. On obtient alors 
f(b) = (b—a)f'(a) + (b— a} &. 


Il suffit alors de poursuivre ce procédé en l'appliquant aux 
dérivées successives tant qu'elles vérifient les hypothèses 
de départ. On obtient alors que, pour toute fonction 
x f (x) définie et continue sur [a, b], dont les n pre- 
mières dérivées existent et sont continues sur Ja, bf, et 
(n = 1) fois dérivable au point a, on peut écrire : 


(fig. 13), puisqu'en ce pointf’(c) — Il suf- 


F (x) = f(x) —f (a) — (x— 2) 


F’(c) = f’(c) — 


1.G.D.A. 
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À A gauche, figure 10 : 
représentation graphique 
du concept de dérivée. 

A droite, tableau 11 : 
dérivées des fonctions 
les plus usuelles 

et règles d'opérations 
sur les dérivées. 


<« A gauche, figure 12: 
interprétation graphique 
du théorème de Rolle. 

À droite, figure 13 : 
interprétation graphique 
du théorème 

des accroissements finis. 


Développement en série 


1+mxt et 


n 
Log (1 + x) = à on 
Log (1 — x) x 


m(M=T) 2 ,..., mm 1)... m=p+1) P,... : 


silx|<1 


‘sixe]-1,+1] 


1.3... (2n-1x* +" 
2.4.6.... (2n)(2n +1) 


silxi<1 


| silxl<1 


PER 
Log x 

» 
x 


1 _ 
zlx LÉ TEE 
a? Log (x + Va + x | 


cos ax sin ax 


ER 
c c 


Log (cx + d) 


=== AC 2er 
Vaac - b° Vaac-b? 
En SEOEEe 


ER Re 
Vb? - 4ac Yb° - 4ac 
sib?- 4ac>o 


ax?+bx+c 


2(2ax + b) 


(4ac — b)fax? + bx+c 


1 
1 

— 7 cosax 
a 


Lx = À sin 2ax 
27 aan or 


n(ax + b)}— 
min Yax +b 


sin” 
 . . 


SEX 
Arc sin — 
a 


sin ax x Cos ax 


2@x = 2b) Yax +b 
3a° a? a 


2Vax + D)": ? 


1 


Sin ax COS ax 


Ù 
: Log tg ax 
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Primitive 
1 on - 
En SRE 
am+? sin#-1 


1 
an+1 °% 


IX 
sin#-1 


1 
a Log cos ax 


xLogx-x 


x{Log x)? — 2 xLog x + 2x 


{Log x)" 7" 


: (sin Log x - cos Log x) 


e* 
77773 (a sin bx 
& +" -b cos bx) 


sx HE PERL Y 
x ANG sin — +la- x 


de — gÿ 
so =r (+ Pr (0) + LE sr (+ … 


(b— ar +1 
(n +1)! 


b— a)" 0 1 | 
ss f@) (a) - 


[f@+D (3) + €] 
où € —+ O lorsque b —+ a. 

La même formule où l'on pose x = beta = 0 est appe- 
lée formule de MacLaurin (Colin MacLaurin, 1698-1746, 
mathématicien écossais) et pose le problème suivant : si 
la fonction f est indéfiniment dérivable, peut-on pour- 
suivre le développement du second membre à un nombre 
infini de termes (afin d'obtenir une excellente précision 
d'approximation) ? En effet, la série alors obtenue est- 
elle convergente, et sa somme est-elle bien égale au 
premier membre? La réponse est négative; seule une 
certaine catégorie de fonctions, dites alors analytiques, 
possèdent cette propriété (voir Séries et Fonctions de 
variable complexe). Le tableau 14 donne les exemples les 
plus courants de ces fonctions et leur développement en 
série entière. 

Le problème inverse de la dérivation des fonctions est 
celui de la recherche des primitives. On dit que la fonc- 
tion F est une primitive de la fonction f sur l'intervalle 
[a, b] si, en tout point de [a, b], F est dérivable, et sa 
dérivée égale à f. On parle d'une des primitives de la 
fonction , car, si F est une primitive, alors F + K, où k est 
constant, vérifie les mêmes propriétés. Il existe donc une 
infinité de primitives d'une fonction dès lors qu'il en 
existe une. On appelle alors intégrale indéfinie de la fonc- 
tion xt f (x) sur [a, b] l'ensemble des primitives de la 
fonction sur [a, b], et on note [HE dx; le signe ( 
est dit signe d'intégration (ou signe somme). 

L'intégration est toutefois à séparer sur deux points de 
la dérivation : 

— une fonction qui admet des primitives (on montre 
qu'il suffit qu'elle soit continue) n'est pas toujours 
dérivable ; 

— le résultat de l'intégration n'est pas déterminé de 
manière unique. 

Sur le tableau 15, on a figuré les résultats les plus cou- 
rants de la recherche de primitives (que l'on pourra 
rapprocher du tableau 11). 

Les liens entre cette notion, celle d'aire et celle d'inté- 
grale définie sont développés plus loin, sous le titre 
Intégration des fonctions. Rappelons simplement que 
l'on appelle figure plane simple une réunion finie de 
triangles d'un même plan et que ces figures possèdent les 
propriétés de monotonie, additivité et invariance (voir 
Géométrie). 

Pour une figure plane F quelconque, on considère l'en- 
semble des figures simples contenues dans F, soit 61 
et l'ensemble des figures simples contenant F, soit 62. 
S'il existe, pour tout nombre € aussi petit qu'on le désire, 
un élément de 61 et un élément de 62 tels que la différence 
de leurs surfaces soit inférieure à «, on dit que la figure 
F est mesurable au sens de Jordan; en posant alors #1, 
ensemble des nombres, surfaces des éléments de 61, 
et Æo ensemble des nombres, surfaces des éléments de 6, 
la surface ou aire de F sera le nombre séparant #1 et #2. 
L'aire d’une surface (fig. 16) définie par un arc de courbe 
est alors définie par la limite — lorsqu'elle existe — des 
sommes de Darboux : 


n—1 


pi (Xi +1 — Xi) F (Xi +1) 


= 1 


n— 1 

D Cx:1—x)f(x) et 
i=1 
lorsque n — ©; ces sommes représentent la surface des 


rectangles inférieurs et supérieurs à la courbe. Lorsque la 
surface est mesurable, alors la limite existe et se note 


rb 
| f (x) dx (intégrale définie de f (x) sur l'intervalle [a, b]). 
va 


On peut alors montrer qu’en maintenant a fixe, et en 
faisant varier b — qu'on pose égal à une variable t — 


rt 
l'aire | f (x) dx =S (t), si elle existe en tout point t 
va 


d'un intervalle |, est alors une fonction dérivable de #, 
et l'on a S’ (t) — f (t). En d'autres termes, toute fonc- 
tion continue f (x) définie sur un intervalle [a, b] admet 
une primitive sur cet intervalle, qui n'est autre que 
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1 
| f (t) dt, où c est un point quelconque de [a, b]. 
C 


Il est alors aisé d'en déduire que, si F désigne une primi- 
tive de f sur l'intervalle [a, b], on a 


08 dx = F(b)—F (a), 


J 


formule permettant la réalisation des calculs. 

La restriction sévère que l'on a mise à ce développe- 
ment en ne formulant de résultats que pour les fonctions 
continues est levée dans le paragraphe /ntégration des 
fonctions. 


Fonctions de plusieurs variables 


L'extension la plus naturelle des notions de calcul 
différentiel et intégral introduites pour les fonctions réelles 
d'une variable réelle est obtenue par l'étude des fonctions 
réelles de plusieurs variables réelles, c'est-à-dire des 
applications f: R7 = R, que l'on représente par l'écri- 
ture y = f (x1, X2, …, Xn), Où chaque x; est une variable 
réelle ; nous noterons parfois X le point (x1, X2, …, Xn) ER, 
et donc y = f (X). Il n'est pas nécessaire de développer 
plus particulièrement pour les fonctions de plusieurs 
variables les notions déjà dégagées de fonction et de 
domaine de définitions. Dans ce qui suit, on suppose que 
les variables x1, x2, …, x sont indépendantes, c'est-à-dire 
qu'il n'existe pas de correspondance présupposée entre 
elles. 

Les topologies que l’on peut déterminer sur R* per- 
mettent de définir les notions de limite et de continuité; 
par exemple, soit y = f (X) une fonction définie sur 
un ensemble E € R? et soit X0 — (x9, x0, …, x0) un 
point non isolé de E, on dit que f (X) est continue en X0 
si, à tout nombre € > 0 arbitraire, on peut associer un 
nombre n > 0 — en général n dépend de £ — tel que 
|F (X) — F (X0)| < € dès que XE E est à distance de X0 
inférieure à n. 

On définit aussi la continuité partielle par rapport à 
l'une des n variables réelles x; en supposant fixes — donc 
constantes — les (n— 1) autres variables; y est à ce 
moment fonction d'une seule variable réelle. La continuité 
par rapport à l'ensemble des n variables réelles est une 
notion très forte qui inclut chaque continuité partielle; 
tandis qu'une fonction continue par rapport à chaque 
variable n'est pas nécessairement continue « globale- 
ment », cette dernière notion entraînant, en fait, la conti- 
nuité selon n'importe quelle direction de R7. Par exemple, 
la fonction définie sur R2 par y = = si (x1, x2) # (0,0) 

15X 
et y = O si (x1, x2) — (0, O) est continue par rapport à x1 
et par rapport à x2, mais n’est pas continue le long de la 


bissectrice x1 — x2 puisque alors y — ; si (x1,x2) (0,0), 


tandis que y = O si (x1, x2) — (0, 0) ; cette fonction n'est 
donc pas continue à l'origine. 


L'influence de chaque variable sur la variation de la 
fonction est mesurée par la dérivée partielle de f par 
rapport à cette variable : on appelle dérivée partielle de f 
par rapport à la variable x®, au point X0, la dérivée de la 
fonction de xx, en x?, obtenue en fixant les autres variables 


x g L of 
à leur valeur au point X°; on note le résultat | — ce 


xx X0" 
symbole n'étant évidemment pas une fraction. 
Plus généralement, on appelle dérivée le long de la 
direction V (V étant un vecteur unitaire issu du point X0) 
O sie _—— 0 
la limite du rapport CC + M) 7 0) lorsque h ER 
tend vers zéro de telle sorte que X0 + AV reste dans le 
domaine de définition de 7. Il faut noter que, contraire- 
ment à ce qui se passe dans le cas des fonctions d'une 
variable réelle, l'existence des dérivées partielles n'en- 
traîne pas la continuité ; l'existence de la dérivée partielle 
par rapport à une variable entraîne la continuité partielle 
par rapport à celle-ci. Toutefois, une propriété plus riche, 
la différentiabilité, entraîne la continuité et la dérivabilité 
le long de n'importe quelle direction. La fonction y = f (x) 
est différentiable au point X0 du domaine de définition E 
s'il existe un vecteur P = (p1, …, Pr) € R? — dépendant 
de f et de X0 — vérifiant l'égalité 


FX + W)—F(X0) = D piwi+ 


i=1 


e (W) : ]W] 


où = (W) est une fonction réelle tendant vers O lorsque 
.…. + wà)1/2 = 0) pour tout vecteur 


(W1, .…, Wn) € R' tel que X + WEE. 
n 
L'expression df = > piwi s'appelle la différentielle de f 
i=1 
en X0 pour l'accroissement W. Le vecteur P s'appelle le 
gradient de f en X° et se note grad x° f. 


Toute fonction différentiable en un point X0 est continue 
en ce point et y admet des dérivées partielles finies selon 


Es o — Pi pour tout /; par contre, la continuité en un 
OXi/ xX 

point X0 et l'existence de dérivées partielles finies en ce 
point n'entrainent pas la différentiabilité de la fonction en 
X0; il s’agit d'un concept plus fort que l’on retrouve pour 
les fonctions de variable complexe avec la notion d'holo- 
morphie. On convient de noter dx; au lieu de w; et la 
différentielle s'écrit donc : 

Pda à LATE LE té 

OX1 CX2 IX 


Considérons une fonction z = f (x, y) définie et diffé- 
rentiable sur un ensemble E € R2. On peut interpréter le 
couple (x, y) comme un point du plan (x, y, 0) de R3: 
les points (x, y, f (x, y)) de R3 forment alors la surface 
représentative de la fonction. L’accroissement Az de la 
fonction résultant du passage de (x, y) à (x + dx, y + dy) 
s'écarte de la différentielle par la quantité e (W) : |W] où 

lim € (W) = 0, qui est donc négligeable par rapport 
WI — 0 
à df (sauf lorsque df — 0). Ceci signifie géométriquement 
qu'il est — sauf exceptions — possible d'approcher la 
surface représentant la fonction au voisinage d'un point 
par le plan tangent à cette surface en ce point (fig. 16 bis). 

Lorsque la fonction f (X) admet des dérivées partielles 
finies en tout point XE FE, chacune de celles-ci est à son 
tour une fonction de X — (x1, …, Xn) définie sur E. Ceci 
conduit à la notion de dérivée partielle seconde; par 


df = 


fes 
exemple, supposons que chaque _. (= 1,2, 0) 
6 


soit dérivable par rapport à tout xx, on obtiendra les déri- 
vées du second ordre : 


8 / 4 &f. à (# ef . 
©x1 Er 0x2" êx2 êx1 Ôx2 €x1" 
ë E ef . 
"* Oxn \Oxy EXn CX1 
… 0 [© e?f 
et aussi — Ês ue 
OXj \OXk/ OX; OXE 
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« Page ci-contre en haut, 
tableau 14 : 
développement en série 
des fonctions analytiques 
usuelles. 


« Figure 16 : 
interprétation graphique 
du concept d'intégrale 
définie : recherche de l'aire 
du trapèze curviligne ABDC. 


« Page ci-contre en bas, 
tableau 15 : 
recherche de primitives. 
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A Figure 17: 
décomposition 

d'un rectangle A 

en rectangles partiels 

de surface oix, 

pour l'intégration 

de la fonction z = % (x, y). 


On pourrait donc être tenté de conclure à l'existence de 
A3 = n (n—1) dérivées du second ordre. 
Un résultat classique connu sous le nom de théorème 


. Cf ef L 
de Schwartz montre que, si —— et ——— existent et 
OXi OXj OXj OX; 


sont finies dans un voisinage de X° et sont continues en X0, 
alors 
( ef | ©?f ] 
ox: Exjlxe  \Ex; Exi]xe 

De façon analogue, on définirait les dérivées du troi- 

e3f C3f 
5 Qi; ‘OU 
CX1 CX2 OX3 OX2 OX _ 
d'ordre encore supérieur, auxquelles on peut étendre le 
théorème d'interversion de l'ordre des dérivations sous 
les hypothèses vues ci-dessus; par exemple 

C3f e3f 
ox? ÔX2 cs êx2 ox? 

De même, on définira la différentielle seconde, troisième, 
… n-ième de f; par exemple, pour une fonction f (x, y) 
admettant des dérivées secondes continues : 

e?f 
©x ©y 
Il est alors possible de généraliser l'approximation de 
l'accroissement de 7 par sa différentielle en montrant, sous 
des hypothèses de régularité pour la fonction, la formule 
de Taylor à plusieurs variables, à l'ordre K: 


sième ordre, par exemple 


2f C2f 
2 2 1 2 
d?f EE (dx)? + 2 dx dy - EE (dy}2. 


F (X0 + W) —f (X0) = df - dt + 7 


1 1 
va nit PE (dëf)x9 : ow, où 68€e]0, 1[ 
(il est à noter que chacune des expressions d’”f est en 
fait un polynôme homogène de degré m par rapport aux 
variables wi, W2, …, Wa). 

Dans de nombreux problèmes existe un lien de dépen- 
dance entre variables d’une même fonction; par exemple, 
si l'on se donne deux variables x et y et la fonction 
o (x, y) = 8 y3 + 2 xy2— x2y — x8, il suffit d'assujettir 
© (x, y) à être nul pour créer un tel lien entre x et y, que 
l'on dit être implicite. Géométriquement, ceci conduit 
à dire que l’on ne considérera pas la surface z = © (x, y) 
mais la courbe obtenue sur le plan z — © parintersection; 
on peut donc se demander s’il existe une correspondance 
qui, à tout x choisi dans un certain intervalle |, associe 
un unique y — y (x) tel que © (x, y (x)) = O0 pour tout 
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xæel. Ainsi, dans notre exemple, on peut voir que les 


Rte 

couples (x, y) tels que y = 5 vérifient © (x, y) = 0. 
Sans chercher à donner une forme explicite de cette 

relation, le théorème suivant précise la fonction implicite 

par ses propriétés : soit o (x, y) définie sur le rectangle 

Xo—a<X< Xo+a Yo—b<y< yo + b, continue 


Eee > à 
sur ce rectangle et y admettant des dérivées partielles _ 


êo : êo , 2 L 
et — continues, avec —Æ © en tout point. Si 
cy Cy 


@ (Xo, yo) = 0, 


alors il existe un intervalle ouvert xo — x < X < Xo + &, 
avec « < a, et une fonction unique y = f (x) définie 
sur cet intervalle telle que yo =  (xo), © (x, f (x)) = 0 
pour tout xE ]xo— «x, xo + «[, qui soit continue et 
dérivable ; la dérivée de cette fonction est alors donnée 
par: 


L'intégration des fonctions de plusieurs variables géné- 
-b 

ralise la notion d'intégrale définie | f (x) dx mais peut 
va 


être replacée dans le cadre général de la « mesure » 
(voir /ntégration des fonctions). Par exemple, soit 
z— © (x, y) une fonction de deux variables définies sur 
le rectangle À = [a, b] X [c, d]; en partageant le seg- 
ment [a, b] à l’aide des points «; et le segment [c, d] à 
l'aide des points y, on découpe le rectangle R en petits 
rectangles de surface e:x. On peut alors considérer 
(fig. 17) les parallélépipèdes dont les bases sont ces 
petits rectangles, et limités par la surface représentant 
z = © (x, y), soit au point le plus bas, soit au point le plus 
haut ; la somme de leurs volumes, lorsqu'elle a une limite 
pour une surface ex de plus en plus petite, définira alors, 
par cette limite, la valeur de l'intégrale de © (x, y) sur le 


domaine A : | | o (x, y) dxdy. Ceci peut évidemment 
J JA 


se généraliser à un domaine À quelconque, mais mesurable 
(au sens de Jordan). Dans le même ordre d'idée, on peut 
définir de façon analogue les intégrales triples 


[ [ [ _® (x y.z) dxdyaz, 
V 


ou multiples en général 
| | _ | o (Xx1 X2, .…., Xn) dX1 dx … dXn. 


Le calcul des intégrales doubles (ce qui se généralise 
avec intégrales multiples) se fait par le théorème de 
Fubini qui permet de se ramener à celui de deux inté- 
grales relatives chacune à une seule variable. Ainsi, dans 
le cas d'un domaine rectangle A = [a, b] x [c, d], 


si | | . o (x, y) dxdy existe, on a: 


[fe cn day = [ay [ex n = 
J J À Je Ja 


b rad 
dx | o (x y) dy 
va CA 


On considère donc d'abord © comme fonction de x, 
on l'intègre sur [a, b] et le résultat obtenu qui dépend de y, 
soit L (y), est intégré sur [c, d] (la seconde égalité pro- 
cède en sens inverse). Dans le cas d’un domaine C quel- 
conque, on établit un résultat analogue : 


rà(T) 
. ® (x y) dy, 


d @ J Y(X 
où les intervalles d'intégration ne sont plus fixes mais 
dépendent de la frontière de C (fig. 18). 


Ainsi, le calcul de | | (x + y) dxdy, où C est la 
JJe 


partie du premier quadrant comprise entre les courbes 
XxH et, x et et la droite x = 2 (fig. 19), donne : 


2 s Z 
ff (x + y) dxdy — | ds |. (x + y) dy = 
JC J0 Je 


f (xe ne Li e?z — xe-T — L es) dx = 
0 " 2 2 


e2 + 3e2- 2 (et es) —1+ 20,96. 


Le calcul intégral se généralise encore avec l'introduc- 
tion des intégrales de surface, de volume, etc., ou inté- 
grales vectorielles, que l'on traite plus aisément par 
l'outil des formes différentielles, aspect particulièrement 
riche du calcul différentiel sur les espaces de Banach où 
la notion de dérivée est remplacée par celle d'application 
linéaire tangente : on peut ainsi traiter l'ensemble des 
problèmes — quel que soit le nombre de variables — dans 
un cadre global. 


Intégration des fonctions 


La mesure 


Certainement l’un des aspects les plus connus de l'ana- 
lyse mathématique, la théorie de l'intégration a connu avec 
la théorie de la mesure (et ses prolongements en pro- 
babilités) un développement exceptionnel. Une première 
impression pourrait la faire paraître bien théorique, et 
surtout bien éloignée des soucis des mathématiciens de 
l'Antiquité, par exemple. On peut essayer de remédier à 
cette apparence, car, bien qu'il s'agisse en fait d'une 
théorie délicate, et dont les méthodes sont difficiles à 
utiliser, il est possible de mettre en valeur les concepts de 
base et les raisons qui ont poussé aux diverses générali- 
sations successives que l'on peut recenser depuis Eudoxe 
(vers 406-vers 355 avant J.-C.) jusqu'à H. Lebesgue 
(1875-1941), ou même Daniell (1889-1946). 

Le but poursuivi est, comme son nom l'indique, de 
construire un outil théorique permettant de « mesurer », 
et c'est encore une fois un problème de géométrie que 
l'on trouve à la source de cette démarche. Les formules 
donnant la surface d'un triangle, d'un quadrilatère, etc., 
constituent le support théorique de la mesure (d'arpen- 
tage, par exemple). Mais l'extension de nos connaissan- 
ces entraîne, bien entendu, à chercher des possibilités 
de calcul pour des surfaces moins simples, planes d'abord, 
puis gauches. C'est donc bien un problème de mesure 
d'ensembles que l'on veut résoudre. Par conséquent, il 
s'agit de définir les propriétés que l'on peut juger néces- 
saires à une telle opération et les ensembles sur lesquels 
on pense effectuer cette mesure. Sur le premier point, 
on cherche à faire correspondre l'addition (comme pour 
les aires) des mesures d'ensembles à leur réunion dis- 
jointe (fig. 20); et d'autre part, on cherche à rendre cette 
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A% En haut, figure 18 : 
sur chaque dessin, 

la courbe C est partagée 
en 2 arcs correspondant 
à 2 fonctions distinctes, 
soit de x, soit de y, 

et qui donnent les limites 
d'intégration selon l'ordre 
d'intégration choisi. 

A gauche, figure 19: 
domaine D {(x, V)er? 
tels que er? < y < ez 
et0<x< 2} 


Y A gauche, figure 20 : 

a, addition des aires; 

b, non-addition des aires. 
A droite, figure 21 : 
conservation de la mesure 
après isométrie. 
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fig. 21 
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À Figure 22 : 

encadrement d'une fonction 
réelle (en bleu) 

par deux fonctions étagées 
(en rouge et en vert). 


mesure invariante après un « déplacement sans transfor- 
mation », c'est-à-dire par exemple, dans le cas du plan, 
une isométrie, ou bijection du plan pour laquelle les dis- 
tances entre points sont conservées (fig. 21). On est donc 
amené à définir, à partir de l’ensemble X sur lequel on 
désire mesurer, une classe de sous-ensembles, Æ (ceux 


que l'on mesurera), et une application m:4#4-—C 
donnant la mesure. De nombreuses difficultés ont surgi 
dès que l’on a pris pour # l'ensemble S (X) des parties 
de X (problème de la mesure universelle, résolu par 
Banach). 

C'est pourquoi, pour établir une cohérence avec les pro- 
priétés envisagées pour l'application m, on choisit une 
classe stable pour les opérations de réunion et de diffé- 
rence : 


AEA et BeÆ4=AUBEX 
et A—B=[4(ANB)Ee# 


(il y a donc aussi stabilité pour l'intersection) : une 
telle classe Æ est appelée a/gèbre de Boole ou clan. On 
dira alors qu'un espace X est mesuré lorsqu'on a défini 
sur cet ensemble un clan Æ et une application (dite 
mesure) m : Æ —> R+ vérifiant : 

m (AU B) = m (A) + m (B)—m (AN B) 

m(g)=0 

On le note alors (X, #, m): en voici deux exemples 
particulièrement importants : 

— Dans l'ensemble X, la famille Æ des parties de X 
ayant un nombre fini d'éléments est un clan, et l'application 
m:Ab na qui, à tout AE, associe le nombre na 
d'éléments de À, est alors une mesure sur X, dite mesure 
naturelle. 

— Sur la droite réelle R, les réunions finies d'inter- 
valles bornés disjoints deux à deux forment un clan, dit 
clan de Lebesgue ; on définit alors la mesure de Lebesgue 
sur R en posant pour tout intervalle borné | d’extrémités 
a et b,m (1) = b— a, (b > a). La mesure de tout ensemble 
du clan de Lebesgue est alors déduite par additivité. On 
note dx cette mesure. 

La mesure — ainsi définie — des ensembles trouve son 
prolongement naturel dans la mesure des fonctions 
étagées par l'intermédiaire des fonctions caractéristiques 
d'ensembles (on dit parfois indicatrices); si (X,Æ, m) 
désigne un espace mesuré, la fonction caractéristique oA 
d'un ensemble À € Æ est définie par : 


pa(x) =1 sixEA et pa (x —=0 sixef À. 
* 
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C'est la structure d'espace vectoriel de l'ensemble J 
des fonctions #4 qui amène alors à formaliser par des 
notions linéaires l'intégrale de Riemann. 


L'intégrale de Riemann 


L'idée de base de l'intégrale au sens de Riemann est de 
s'assurer d'un outil mesurant les ensembles définis par 
des courbes représentatives de fonctions, et respectant 
la règle d'additivité. Pour cela, on part du cas le plus 
simple d'une fonction caractéristique d'ensemble, puis 
on généralise à une combinaison linéaire de ces fonctions, 
puis à des fonctions « approchées » par de telles combi- 
naisons. 

Dans un espace mesuré (X, Æ, m), à tout ensemble 
AE, on associe sa fonction caractéristique o4 et 


l'on pose :1 (pa) = + | , dm — m (A). Par la linéarité 


de cette correspondance, on peut définir l'intégrale (au 
sens de Riemann) d'une fonction étagée : 
i=n 
f= LA di OA; 
i=1 
par : 
. i=n 
L (f) = | f dm = ss im (A) avec eR. 
L i=1 
Il s’agit alors d'étendre cette forme linéaire à un ensem- 
ble de fonctions plus vaste que l'ensemble £ des fonctions 
étagées : les fonctions nulles en dehors d'un ensemble A 
du clan Æ et bornées. Ceci est possible de la façon sui- 
vante : une telle fonction © peut être minorée et majorée 
respectivement par deux fonctions étagées : f < 5 <g 
(fig. 22), et il est clair que | (f) < 1 (g). Par conséquent, 
les nombres 


| eo dm = sup | fampourfees, f < e) 


et o dm = inf 


| 

| 

| gdmpourges,g > | 
sont liés par la relation : | o dm < o dm. 

On désigne par £ l’ensemble des fonctions ® pour les- 
quelles il y a égalité ; c'est un espace vectoriel — pour les 
lois classiques d'addition et de produit par un scalaire — 
et on a donc étendu la forme linéaire positive | définie 


sur £ en une forme linéaire positive | définie sur £ dès que 
l'on pose : 
: F + 
T(e)= | edm- 
Je d 

Il s'agit là d’une démarche analogue au « principe 
d'exhaustion » d'Eudoxe de Cnide (v.406-v. 355 av. J.-C.) 
par lequel on essayait d'approcher l'aire d'un cercle par les 
surfaces des polygones réguliers inscrits dont on double 
successivement le nombre de côtés (fig. 23) ; les « som- 
mes de Darboux » en sont une autre expression, moins 
claire toutefois (fig. 24). 

Sur l'espace X = [a, b] € R où l'on prend le clan # 
engendré par les intervalles [a, d'[ et [c, b], une fonction 
définie croissante sur [a, b], ©, permet de définir une 
mesure : 


[ m (La, x[) = © (x) 

| m (La, b]) = + (b) 

par rapport à laquelle toutes les fonctions continues réelles 

sont intégrables. L'intégrale d'une fonction g selon cette 

mesure est dite intégrale de Riemann-Stieltjès et se note : 
rb 


o dm 


pour x € ]a, b[ 


I 


gdo. 
C1 
Ceci permet de définir l'intégrale d'une fonction conti- 
nue réelle g par rapport à une fonction à variation bornée 
puisque celle-ci est différence de deux fonctions crois- 
santes o1 et 92: 


b 
| gay = 
J & v 
On peut noter que l'on retrouve l'intégrale classique en 
prenanto:xk x. 


bd L] 
gd — | gde2 si Ÿ = p1— 92 
a Ÿ & 


Cette notion joue un rôle très particulier : on montre 
facilement que l'intégrale de Riemann-Stieltjès est une 
forme linéaire continue sur l’espace de Banach R fa, b] 
(muni de la topologie de la convergence uniforme), mais 
de plus, un très célèbre — et délicat — théorème, le 
théorème de F. Riesz, montre que : toute forme linéaire 
continue sur cet espace est une intégrale de ce type. 
C'est cette notion que l'on utilise pour définir les inté- 
grales curvilignes. 


L'intégrale au sens de Lebesgue 


On peut envisager sous deux aspects l'apport de Lebes- 
gue à la théorie de l'intégration. Tout d'abord, au sens 
« fonctionnel », de même que les nombres réels figurent 
une extension des nombres rationnels (construction de R 
par les coupures ou bien les suites de Cauchy), les fonc- 
tions intégrables au sens de Lebesgue étendent, elles, 
les fonctions intégrables au sens de Riemann (et plus 
particulièrement les fonctions continues, nulles en dehors 
d'un ensemble compact). D'autre part, d'un point de vue 
« ensembliste » et plus rapporté à l'idée générale de 
mesure, les développements de Lebesgue ont permis de 
s'affranchir de la simple additivité, et de définir la mesure 
pour une plus vaste classe d'ensembles, grâce à l'idée 
d'additivité dénombrable posée par Emile Borel (1871- 
1956) qui se traduit par l'hypothèse suivante : « la réu- 
nion d'une famille dénombrable d'éléments de Æ est 
encore un élément de Æ# », qui donne le nom de #ribu 
à une famille Æ de parties d’un ensemble X formant déjà 
un clan. La cohérence avec la notion de mesure est ensuite 
assurée par la définition d'une mesure dénombrablement 
additive (ou bien o-addlitive), c'est-à-dire telle que, pour 
toute famille dénombrable (Az)nen d'éléments de Æ 
deux à deux disjoints (A N A, = Z dès que p # q), 
on ait : 


m{U A) = 2 m (An). 
\neN neN 

Le premier membre a bien un sens puisque l'on sup- 
pose que # est une tribu, le second membre est donc un 
nombre réel positif ou + ©. Au sens de Lebesgue, un 
espace mesuré sera donc un #ériplet (X,Æ,m) où # 
est une tribu et m une mesure 6-additive. 

C'est avec les mesures de Radon que se dégage le 
mieux l'aspect linéaire de l'intégration; elles seront défi- 
nies sur des espaces X supposés localement compacts 
(voir Topologie). On désigne par. (X) l'espace vectoriel 
des fonctions continues sur X, nulles hors d'un compact 
de X. 

Une mesure de Radon positive sur X est une applica- 
tion m : JC (X) + C, linéaire 


donc m (xf + Big) = «m (f) — Sm (g) 


et positive 


donc m (f) > O 


sif > 0. 
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Outre la mesure de Lebesgue, mentionnée plus haut, 
on peut citer : 

— la mesure de Dirac en un point a, notée à,, qui 
est la forme linéaire f+ f (a); 

— Ja mesure de densité p (où p est une fonction 
réelle, continue, positive) par rapport à la mesure de 
Lebesgue : 

fe] f (x) p (x) dx: 


— la mesure naturelle sur un espace discret : 
fr ps f (x). 
xexX 


On dit qu'une fonction 7 définie sur X est /ntégrable pour 
la mesure m (ou m-intégrable) si l'on peut trouver une 
suite {fr}nen de fonctions de JS (X), telle que l'expres- 
sion sup. | © dm pour 9 EX (X) et o < [f— fr] ait une 
limite nulle lorsque n co; la suite {fninen est appelée 
suite d’approximation en moyenne de f. Ceci revient à 
dire que l'on peut approximer la fonction f par une suite 
de fonctions « suffisamment régulières », puisque l'on 
cherche à ajuster la différence |[f— f,| au plus près par 
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« Le mathématicien 
français Gaston Darboux 
(1842-1917) qui a réalisé 
de nombreux travaux 

sur les courbes et surfaces 
algébriques et 

sur les applications 
géométriques du calcul 
infinitésimal. 


Y A gauche, figure 23 : 

a, approximation 

de la circonférence 

ou de l'aire d'un cercle 

par des polygones réguliers 
dont le nombre de côtés 
est systématiquement 
doublé; 

b, détail de 

cette approximation. 

A droite, figure 24 : 
approximation 

par la méthode des sommes 
de Darboux de l'aire 

d'une surface définie 

par un arc de courbe. 
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A Figure 25. 

a, exemple de surface nulle: 
une courbe dans un plan; 

b, exemple 

de surface non nulle : 

une surface dans un plan. 


Figure 26. 

a, exemple de volume nul : 
une surface gauche 

dans l'espace 

(épaisseur nulle); 

b, exemple 

de volume non nul : 

Ja même forme présentant 
une épaisseur non nulle. 


une fonction de moyenne (ou d'intégrale) pratiquement 
nulle dès que n est assez grand. 

On montre que, si la suite {fnnen approche f en 
moyenne, alors la suite des nombres m (f») = | fn° dm 
est convergente, et c'est sa limite — qui d'ailleurs reste 
la même quelle que soit la suite d'approximation choisie — 
que l'on appelle intégrale de f par rapport à la mesure m, 
soit : m (f) = [+ dm=— lim m (fx) = lim [ fn: dm 


Ro nn © 


Espaces £P et L? 

L'ensemble £1 (m) des fonctions m-intégrables est 
un espace vectoriel, puisque la mesure m est une forme 
linéaire ; de plus, il possède la propriété très importante : 


fe (m) = [fl e C1 (m). 


Cet ensemble étend la classe des fonctions intégrables 
au sens de Riemann puisque : 

— toute fonction fEeX (X) est m-intégrable (la 
suite d'approximation est la suite constante / pour tout n); 

— toute fonction étagée, nulle en dehors d'un inter- 
valle borné de R, est intégrable pour la mesure de Lebes- 
gue; cette propriété est encore vraie pour une limite 
uniforme de fonctions étagées. 

Pour la mesure de Dirac, le résultat est encore plus évi- 
dent puisque toute fonction f partout finie est à,-inté- 
grable ; son intégrale vaut f (a). 

De plus, l'application ff |fl* dm est une semi- 
norme sur £1 (m). Ce n'est pas une norme dans le cas 
général; ainsi, pour la mesure de Lebesgue sur R, tout 
ensemble réduit à un point (et, en raison de l'additivité 
dénombrable, tout ensemble dénombrable) admet une 
fonction caractéristique d'intégrale nulle : en effet, tout 
point a€ R peut être placé dans un intervalle ouvert 
| = ]a — €, a + ef où « est arbitraire, et par conséquent 
fot dx 4] çr® dx = 2e. Il peut donc exister des 
fonctions f£ O telles que m (|f|) = 0. Ainsi dans RE, 
la surface d'un segment de droite est nulle (fig. 25 et 26). 
Ce point fondamental est à l'origine du second point 
essentiel de l'intégration au sens de Lebesgue : les pro- 
priétés vérifiées m-presque partout, c'est-à-dire partout 
sauf en un ensemble de points dont la mesure est nulle. 
Ainsi, pour savoir si une fonction f : X = C est intégrable, 
et pour connaître son intégrale, il suffit de connaître 
les valeurs prises par f en presque tout point de X. Par 
conséquent deux fonctions égales m-presque partout et 
intégrables (si l'une l'est, l'autre l'est aussi) ont même 
intégrale. 
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On est donc ainsi amené à définir sur l'espace £1 (m) 
la relation d'équivalence (R) : f æ g si et seulement si 
f= g, m-presque partout, puis à considérer l'espace 

: m 2e 
quotient £1 e (chaque élément de cet espace est donc 
la classe de toutes les fonctions de Ê1 (m), m-presque 
partout égales) que l'on désigne par Ll (m) ou parfois 


L1 (X,#, m). Sur cet espace, l'application | lf| dm 


(f désigne une classe selon la relation (R) dont f est un 
représentant) est une véritable norme; pour la topologie 
induite par cette norme, Li (m) est un espace complet : 
c'est un espace de Banach. L'espace £1 (m) est complet 
pour la semi-norme |f| dm, mais surtout il est « appro- 
ché » par l'espace X (X) ; c'est-à-dire que, pour la topo- 
logie induite par cette semi-norme, À (X) est dense dans 
£1 (m) ; ce qu'on peut encore traduire par le fait que pour 
toute fonction m-intégrable, il doit exister une fonction 
continue nulle hors d'un compact qui « approche » 
(en moyenne) suffisamment la première. 

La notion d'intégrabilité au sens de Lebesgue généralise 
donc l'idée de fonction intégrable au sens de Riemann. 
En particulier, on peut citer deux résultats fondamentaux 
qui montrent bien la richesse de cette extension : 

— le théorème de Beppo-Levi;: pour que la 
limite f d'une suite croissante de fonctions intégrables 
réelles {fninen soit intégrable, il faut et il suffit que la suite 
des nombres | f,° dm soit majorée; dans ce cas, on a 
convergence en moyenne de f, vers fet 


lim 
n— oo J 


| f: dm — | fn ° dm; 

— le théorème de Lebesgue (ou de la conver- 
gence dominée) ; si{fninen est une suite de fonctions 
intégrables, à valeurs complexes, uniformément majorées 
en module par une fonction intégrable, et convergeant 
presque partout vers une fonction 7, alors on a conver- 
gence en moyenne, f est intégrable et 


lim | f,:° dm. 
n— cp V 


FE dm = 


La comparaison de ces critères d'intégrabilité avec ceux 
connus dans le cadre de l'intégrale au sens de Riemann 
montre immédiatement la puissance de l'outil ainsi formé. 
Par exemple, une simple application du théorème de 
Beppo-Levi montre qu'on peut intégrer terme à terme une 
série de fonctions positives : 


| (24) dm= À (| Un* am) 


n 


dès que la série des intégrales (du second membre) est 
convergente. 

De même, le théorème de Lebesgue permet de définir 
des conditions affaiblies sous lesquelles il est possible de 
« dériver sous le signe somme ». 

D'autres espaces peuvent être associés, comme £1 et 
Li, à un espace mesuré (X, Æ, m). Ils se placent dans 
un cadre très général, celui des fonctions mesurables; 
ce terme est malheureusement bien mal adapté au cadre 


général qu'on a tracé ici, car il ne signifie absolument 
pas que l'on ait affaire à des fonctions que l'on puisse 
« mesurer »; nous désignons ces dernières — comme 
nous l'avons vu — par le terme de fonctions intégrables. 

La définition de ces fonctions, que l'on pourrait juger 
un peu mystérieuse à ce point de notre présentation : 
l'application f: X = Y est m-mesurable si, quel que soit 
l'ouvert O & Y, la fonction caractéristique de l’ensemble 
Kn#1(0) (où K est un compact quelconque de X) 
est m-intégrable, repose en fait sur une hypothèse 
«technique » nécessaire à l'exposé rigoureux de la théorie. 
C'est d'ailleurs une notion délicate, car, après avoir déduit 
quelques propriétés de ces fonctions, il semblerait que 
la classe des fonctions mesurables soit particulièrement 
vaste, au point que l'on chercherait à déterminer des fonc- 
tions qui ne le soient pas. Et c'est à l'aide d'une démons- 
tration difficile, faisant intervenir l'axiome du choix, que 
l'on prouve l'existence de fonctions non mesurables. 
Précisons tout de suite que toute fonction m-intégrable 
est aussi m-mesurable. 

L'espace £? (m), p étant un nombre réel 1 < p < +00, 
est défini comme l'ensemble des fonctions m-mesu- 
rables f, telles que |f|? soit intégrable; C’ est un espace 
vectoriel. Ces espaces ne sont pas emboîtés, en général, 
dans un sens ou l’autre : ainsi, pour la mesure de Lebesgue 
sur R, la fonction x + |x|-1/2 (1 + [x|)-1 pour x # 0 
est dans £1 mais non dans £2?, alors que la fonction 
xt (1 + |x|)-lest dans £? mais pas dans £1. 

Pour chaque valeur de p (1 < p < — ©), l'espace 
£? (m) étend l'espace À (X) de telle façon que X (X) 
est partout dense dans £? (m) : ce qui signifie donc que 
pour chaque fonction © € À (X), il existe une fonction 
fe £? (m) telle que le nombre 


Np (— 0) = ([ [f— 0]? am} 


soit rendu aussi petit que l’on veut (il y a approximation 
au sens de £?, en moyenne d'ordre p). 


Intégration et recherche de primitives 

A ce point d'avancement de la théorie de l'intégration, 
on peut se poser la question de savoir si l'on a conservé 
(avec l'outil ainsi mis au point) la possibilité bien connue 
de recherche des primitives d'une fonction, et l'intégrale 
indéfinie au sens usuel. 

En particulier, si l’on prend X — R, muni de la mesure 
de Lebesgue, que devient le résultat? L'application 


PT 
CHR | f (t) dt vérifie ©’ (x) = f (x), bien connu dès 


 & 
que fEXK (X). 

La réponse est fournie par un théorème dû à Lebes- 
gue : on désigne par of, x] la fonction caractéristique de 
l'intervalle [a, x] € R': alors l'application x Îf œta, x] dm 
est m-presque partout dérivable et de dérivée égale à 
f (x), dès que fora, #1 est m-intégrable (on dit alors que f 
est /ocalement intégrable). On pose 


[ fota, «3 dm = |” 5 (9 dt 
« “ « 


(on rappelle qu'ici m représente la mesure de Lebesgue 
sur R), appelé intégrale (indéfinie) de f. 


ard Colin 


Par conséquent toute fonction localement intégrable 
est presque partout égale à la dérivée de son intégrale 
(indéfinie). 

Le problème réciproque nécessite l'introduction d'un 
type particulier de fonctions réelles, les fonctions abso- 
lument continues sur un intervalle [a, b] & R. Une telle 
fonction F satisfait à la propriété : pour tout = > O, 
on peut trouver n > 0 tel que, dès que les sous-intervalles 
[xx, 8x] de [a, b] (un nombre fini) ne se recouvrent pas 
et ont une longueur totale inférieure à , alors 


2 |F Ga) —F (a) < = 


Entre autres propriétés, les fonctions absolument 
continues sont uniformément continues, et à variation 
bornée; de plus, elles peuvent s'exprimer comme diffé- 
rence de deux fonctions croissantes absolument continues. 
Mais surtout, et c'est là la réponse à la question posée, 
une fonction F : [a, b] = C est une intégrale indéfinie 
si et seulement si F est absolument continue, et ce à 
une constante additive près : 

PT 
FH=F()+ | Fa. 
“ «a 

Les résultats que nous avons mentionnés ici et qui 
précisent donc que, relativement à la mesure de Lebesgue 
sur R, l'intégration et la dérivation presque partout sont 
des opérations réciproques, peuvent être mis en forme 
dans un cadre plus général, celui des mesures de densité 
sur un espace X, localement compact et dénombrable 
à l'infini (c'est-à-dire réunion dénombrable de compacts). 
Si m est une mesure positive sur X et p une fonction posi- 
tive, localement intégrable sur X, alors l'application 


fr | f.p: dm est une mesure de Radon positive sur X, 


que l'on appelle mesure de densité p pour la mesure m; 
on la note p*m. On dit qu'une mesure positive u sur X 
est de base m s'il existe une fonction p > 0 localement 
m-intégrable sur X, telle que u = p : m. 

Le théorème de Radon-Nikodym montre alors que, 
pour que soit de base m, il faut et il suffit que tout 
ensemble m-négligeable soit u-négligeable (on dit 
encore que 1 est absolument continue relativement à m). 

On a là, très certainement (par l'intermédiaire des 
mesures de densité), la présentation la plus cohérente 
tant de la dérivation que de l'intégration (il suffit d’ailleurs, 
pour s’en convaincre, de se reporter au concept physique 
de densité) ; c'est ce que l'on retrouve dans les théories 
modernes des probabilités où l'on fait un abondant usage 
des formalismes et résultats de la théorie de la mesure. 

La notion de fonction absolument continue permet 
encore de généraliser la formule d'intégration par parties : 


[5 609 g° Go = 


[f (b) g (b) —f (a) g (a)] — 


[#0 9 00 dx 
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« Un exemple de série 

convergente : la série 

relpéelghaes 
2 4 8 16 

tend vers 2 

quand n tend vers l'infini. 


1 
2° 


— bien connue pour des fonctions de classe C1 sur 
[a, b] — lorsque f et g sont absolument continues sur 
[a, b], toujours grâce aux résultats de Lebesgue sur les 
fonctions presque partout dérivables. 

Signalons enfin que la théorie de l'intégration par rap- 
port à une mesure de Radon positive englobe les problè- 
mes de l'intégration multiple et retrouve tant le théorème 
de Fubini sur la décomposition d'une intégrale n-uplet 
sur un domaine de R?, que la formule du changement de 
variable. 


Les séries 


La notion de limite, fondamentale pour la science 
mathématique, est déjà présente (sous forme rudimen- 
taire) chez les mathématiciens de l'Antiquité par l'inter- 
médiaire des suites 51, S2,…, Sn, …, OÙ l'élément 
Sn (n—1, 2, 3, etc.) peut être un nombre (réel ou 
complexe), un vecteur, une fonction, etc. Une suite se 
présente souvent comme une succession de résultats, 
pour une opération répétée un nombre illimité de fois, 
et ainsi reliés à un « algorithme ». Parmi ces procédés, 
on retiendra comme particulièrement intéressants les séries 
qui se présentent comme une généralisation de l'addition, 
et les produits infinis, généralisant la multiplication. 


Séries numériques 


Un premier exemple élémentaire de série est celui que 
l'on obtient si l’on veut représenter un nombre rationnel 
au moyen des nombres décimaux; par exemple, la repré- 
sentation décimale du nombre rationnel 1/6 est 0,166 66... 
qui « équivaut » à la série : 


10 102 103 107 
L'intuition suggère alors d'écrire : = — 1 — Fe + 
gg é 5 =10* 10% * 


c'est-à-dire d'égaler le symbole du second membre 
au nombre 1/6. On observe tout de suite que l'éga- 
lisation entre un tel symbole et un nombre nous 
entraîne à construire sur ces nouveaux êtres mathéma- 
tiques des règles de calcul cohérentes avec celles des 
nombres et avec leurs propriétés. Ainsi, la somme des 


: 1 . 
k premiers termes = + = + = +. — diffère 


1 
10 10€ 


dei d'aussi peu que l’on désire, à condition de choisir k 
suffisamment grand. 

Définissons alors une série : étant donné la suite 
&o, 41, 42, …, an de nombres (ou plus généralement d'élé- 
ments appartenant à un ensemble sur lequel on a défini 
une opération d'addition et qui est stable pour cette 
opération), on appelle série le symbole 


80 + 41 + 4 + … + An + … 
ao 
aussi écrit > an (an est le terme général de la série). 
n=0 
Avec cette écriture, on entend construire la suite des 
sommes partielles : 


So = &0, S1 — 40 + 41, S2 — 40 + 41 + 42, .…., 


Sn = 40 + 41 + 82 + … + An, 


et donner ainsi à la série les caractères (convergence, 
divergence, etc.) de cette suite. 


S'il existe un nombre fini À tel que lim sx = À, la 


n + © 
série est dite convergente, et l'on dit que À est sa somme : 
le, la série 1 - À,n1 + + 1 alors 
par exemple, starter gt 
: 5 
So = 1, Hel+rsss 
1 
1e 2R+1 / 1 
Sn = | =2 {1 31) — 2 lorsque n — ©0. 
15 
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Dans le cas où lim sx — +00 où bien —co, la 
n— + oo 
série est dite divergente : par exemple, 1 + 1 + 1 + .; 
alors s1 = 1, 52 = 2, …, Sn — n, et donc s: croît sans 
limite. 


Enfin, lorsque lim s, n'existe pas, la série est dite 


An — © 

oscillante où irrégulière (par exemple, 1 —1 + 1— 1 + ...; 
alors so = 1, s1 = 0, so — 1,53 — 0, etc.). 

Les séries convergentes et les séries divergentes sont 
dites régulières. Notons que, lorsque l'on a lim sx — © 

n— 

(sans être précisément + oo ou — ©), pour connaître si 
la série est divergente ou bien oscillante, il est nécessaire 
de préciser la façon dont l'axe réel a été « compactifié » : 
car, lorsqu'il l'a été par l'adjonction des points + © 
et — ©, alors une série dont les sommes partielles sont 
par exemple 


So = 0,51 1,52= + 2,58 3,54 = +4,.…, 


n'admettant pas de limite (ni + ©, ni —) est à cause 
de cela oscillante, tandis que si l'axe réel a été compactifié 
par l'adjonction du seul point ©, alors la suite O0, — 1, 
+ 2,— 3, + 4,.…., admet une limite infinie, et la série est 
alors divergente. 

Prenons quelques exemples : 


| 1 
— puisque ñ ere nee on constate 


(n+7) n n+1 
aisément la convergence de la série de Mengoli dont la 
somme est : 


Gel nt 1 
1:2 2.3 3.4 n(n+T) 7 
— la série « géométrique » 
Eg—=1+q+qg+..+qr+.… 
(de raison q) a un caractère dépendant de la valeur de q; 
en effet, puisque Sn = 1+qg+.….+gt— _— 


on reconnaît la convergence (avec une somme égale à 


— lorsque |g| < 1, la divergence pour |q| > 1 


et g = 1, tandis que la série est oscillante si q = 1; 
1 


— la série « harmonique » 1 + ; + 3 Se 


est divergente et la somme partielle sy = 1 + 


a À 


+ L vérifie Sn = Log n + C+e (n), où C = 0,57... 


(constante dite d'Euler-Mascheroni) et « (n) est un 
correctif d’approximation qui tend vers zéro lorsque n 
tend vers l'infini. 


Le] co 
Pour toute série 1 an On peut considérer la série 2 lan; 


dans le cas où cette dernière série est convergente, alors 
la première l'est aussi, et l'on dit qu'elle est absolument 
convergente. Toutefois, une série peut converger au sens 
ordinaire sans être absolument convergente; ainsi en 
est-il de la série harmonique alternée : 
izi Lu Lu + ( 111 
2 3 n 
Pour toute série convergente, le terme général a, doit 
tendre vers zéro lorsque n — ©; toutefois, ici encore, il 
s'agit d’une condition nécessaire mais non suffisante de 
convergence, ainsi qu'on le vérifie par l'exemple de la série 
1 1 


dé se El 


23 “ n 


harmonique 1 + 


Propriétés formelles des séries 

Une série se présente comme une généralisation « natu- 
relle » de l'opération arithmétique qu'est l'addition, à 
travers un processus de passage à la limite (où l'on étend 
un classique algorithme fini à un algorithme infini). 
L'addition possède de nombreuses propriétés formelles : 
associativité, commutativité, etc. Dans quelle mesure 
ces propriétés se conservent-elles (ou donnent-elles lieu 
à des propriétés analogues) pour les séries? A cette 
question, on peut répondre qu'en général il n'y a pas 
conservation ; plus précisément en trois points : 


— Lorsque l’on regroupe, par une loi quelconque, 
un ensemble de termes consécutifs, dans une série conver- 
gente, on obtient une série convergente et de même 
somme ; en procédant de même dans une série divergente 
vers + © (respectivement — ©), on retrouve une série 
divergente vers + 00 (resp. — 0). Par conséquent, la 
propriété d'associativité reste valable pour les séries 
régulières. 

— Mais, à cette exception près des séries régulières, 
on ne peut plus rien affirmer. Par exemple, la série 
1—1+1—1--.. est oscillante, alors que la série 
obtenue à partir de celle-ci en regroupant les termes deux 
à deux, c'est-à-dire : (1 1) (1 1)+ (1 1) + …, 
soit 0 + O + O + …., est convergente et de somme égale 
à zéro. 

— L'examen de la commutativité nécessite d'abord 
de préciser la notion de « permutation dans l'ordre des 
termes » (particulièrement dans le cas d'une infinité de 
termes) et permet alors de retrouver une notion forte de 
convergence. Étant donné deux séries Z ux et 2 V», 
on dit que l’une s'obtient à partir de l'autre par permuta- 
tion de l’ordre des termes lorsque existe une corres- 
pondance biunivoque entre les rangs des termes des 
deux séries, de telle façon que, pour des rangs qui se 
correspondent, on ait des termes égaux. Par exemple : 


1 1 
ne Gé 

1 dat - 1 
ES D ER EL 


Une série convergente, telle que toute autre série obte- 
nue par permutation dans l'ordre des termes soit aussi 
convergente, est dite /nconditionnellement convergente ; 
cette notion est en fait équivalente à celle de la conver- 
gence absolue. Une telle série et toutes celles obtenues 
par le procédé décrit ont la même somme : pour elles, on a 
donc conservation de la propriété de commutativité. 


Opérations sur les séries convergentes 

Étant donné deux séries convergentes Ÿ ax = À, 
Zbn=—=B, on définit naturellement les opérations 
d'addition des deux séries et de multiplication de l'une 
d'elles par un nombre : 


Zan + Zbn = E (an + bn) 
c:Zan=ZEC.an 


les séries obtenues 2 (ax + b:) et Z c : an sont conver- 
gentes, et leurs sommes sont respectivement À + B et 
c*A. 

Le produit de deux séries Y a, et 2 b» conduit for- 


mellement à une série double > anbm, pour laquelle on 
n,m 


peut envisager divers modes de regroupement de termes 
pour construire une série Z uyx. On se limitera ici à citer le 
produit selon Cauchy, dans lequel le terme ux est cons- 
truit de la façon suivante : 
1=k 
Ur = 80bx + 810% -1+ 82bx -2 + + axbo = Fi ab -1. 
1=0 


Cette notion de produit est la plus naturelle pour des séries 
entières (se reporter au paragraphe sur les Séries entières), 
puisque, dans ce cas, la série produit obtenue est elle 
aussi une série entière. La convergence de la série Z ux 
et la relation espérée U = A . B entre les sommes A et B 
des facteurs et la somme Ü de la série produit ne sont 
toutefois assurées qu'avec des hypothèses complé- 
mentaires sur les séries Z a; et ZbA (la convergence 
absolue de ces séries, par exemple). 


Critères de convergence des séries 
Pour déterminer le caractère d'une série, ce n'est en 
général pas à la définition de la convergence que l'on a 
recours, mais plutôt à l’un des multiples critères exposés 
ci-dessous : 
e Condition de Cauchy. Une condition nécessaire et 
suffisante pour que la série Ÿ 4, soit convergente est que, 
pour tout nombre £ > O, on puisse déterminer un indice N 


(dépendant en général de €) tel que, pour tout entier 


n > Net tout entier p > O0, on ait: 
lan+1 + an +2 + an+p|l < €. 


e Conditions suffisantes de convergence. Parmi 
celles-ci on peut citer : 

— le critère de comparaison; pour deux séries à 
termes positifs (c'est-à-dire non négatifs), © a» et 
E bn vérifiant 4: < bh, lorsque © b converge, il en est 
de même pour E 4,, et lorsque Y a, diverge, alors Y bx 
diverge aussi; 

— le critère de D'Alembert; étant donné la série 
E an (an > 0), s'il existe un nombre «, 0 < x < 1, tel 

An + 


1 _ 
que < 2, alors cette série est convergente: elle est 


An 
divergente si es > 1; 
An 
— le critère de Cauchy; étant donné la série 
Lan (ar > 0), s'il existe un nombre 8, 0 < 8 < 1, 
tel que : #Van < 8, cette série est convergente; elle est 
divergente si : 2\a» > 1. 

Pour ces trois critères, les conditions (inégalités) à 
remplir peuvent n'être réalisées qu'à partir d'une certaine 
valeur de l'indice; c'est en effet le comportement pour 
n —=@ qui détermine la nature de la série. Modifier un 
nombre fini de termes ne peut donc pas changer le carac- 
tère d'une série, mais au plus sa somme lorsque cette série 
est convergente. 

e Un type fréquent de série est celui des séries 
alternées, c'est-à-dire celles dont deux termes consécutifs 
sont de signes opposés : Uo— U1 + U2— u3 + Ua — … 
(où ur > 0). Pour qu'une telle série soit convergente, 
il suffit, outre la condition générale u, —> 0 lorsque n +00, 
qu'elle soit à termes décroissants, c'est-à-dire que l'on 
at:UoZzU1>Z U2 > … 

Avant de développer d'autres questions, notons que, 
sur l'exemple qui nous a servi de présentation, le calcul de 
la somme de la série peut être réalisé aisément grâce à 
la série géométrique. On peut en effet écrire : 


10 10? 10 104 


10 10 10 10 
1 6 1 ere 1 
610% 1) 10 15 6 

10 


ce qui correspond bien à la considération de départ. 


Séries de fonctions 


La notion introduite par les séries numériques s'étend 
par les séries de fonctions (plus généralement encore par 
les séries de fonctions vectorielles pour lesquelles on a 
besoin des outils de l'analyse fonctionnelle, développés 
au chapitre correspondant) ; dans ce paragraphe, on ne 
considérera que des fonctions réelles d'une seule variable 
réelle. 

Si {un (x)} (n = 0, 1, 2, 3, …) désigne une suite de 
fonctions uA (x) toutes définies sur le même ensemble 
ER, pour toute valeur x EE, {un (xo)} est une suite 

ce 
numérique ; le symbole à Un (xo) est alors défini, ainsi 
n=0 
que toutes les notions (convergence, divergence, etc.) 
qui s'y rattachent. Par contre, lorsqu'on considère x 


Le] 
comme une variable décrivant E, 2 Un (x) se présente 
n=0 


© 
comme une série de fonctions de la variable x; si > Un (X) 


converge pour toute valeur X€ E, on dira que la série 
converge dans E, et la somme $S (x) est une fonction 
définie dans E. 

Par exemple, la série géométrique 


D'un = TEXHXÈTH HE 
converge dans l'intervalle ]— 1, + 1[ (intervalle ouvert) 


1 , Le 
et y a pour somme S (x) = pe On dit que la série 


Le] 
> Un (x) est absolument convergente dans E si la série 
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À Figure 27 : 

exemple d'une série 

de fonctions continues 

sur un intervalle 

gui converge 

(non uniformément) 

et dont la somme 

n'est pas continue; 

on l'obtient avec 

Uo(x) = 1, Un(x) = x71+ (x-1) 

sur l'intervalle [0, 1]; 

les sommes partielles 

So (X) = 1, S1 (x) = X, …, 

Sn (X)=1+(x—1) 

(TER É..S SE UT) 

montrent que Sn (1) = 1 

pour toutnen, donc 

que S (1) = 1; 

par contre sixe[0, 1[ 

Sn (X) = 

1 

= x 


1+(x—1): =} 
et donc S (x) = 0. 


» Figure 28 : 
cercle de convergence 
de la série entière 


Lee] 
2, Cr (z— a)", z 


étant une variable complexe. 
Le cercle hachuré, 
concentrique 

et de rayon inférieur, 
représente un ensemble 

de points dans lequel 

la série donnée 

est uniformément 
convergente. 


Le] 


} lux (x)| converge dans E. 


C'est en cherchant à étendre aux séries de fonctions 
les quelques opérations déjà connues pour des sommes 
finies de fonctions (par exemple, le passage à la limite, 
la continuité, la dérivation ou l'intégration terme à terme) 
que s'est dégagée la notion fondamentale de convergence 
uniforme. 


Le] 
Lorsque la série Ÿ Un (x) converge dans E avec une 


somme égale à S (x), alors, pour tout xE E, si l'on fixe 

e > 0, on peut trouver un entier no = no (:, x) tel que, 

dès que 7 > no, On ait: 

: " , 

S (x) — ug (x)| < &. 
G— > uw ) 


Il arrive que, pour £ > 0 fixé, il soit possible de déter- 
miner l’entier n0 en ne tenant compte que de € (par consé- 
quent, cet entier reste le même pour toutes les valeurs de 
xXEE), de telle façon que la condition précédente soit 
vérifiée. C'est dans ce cas que l'on dit que la série est 
uniformément convergente dans E; il est évident que la 
notion de convergence uniforme est relative au compor- 
tement de la série sur un ensemble, et non pas en un 
seul point. 

Pour la convergence uniforme, on a encore la condi- 
tion générale suivante (dite de Cauchy) : une condi- 


Le] 
tion nécessaire et suffisante pour que la série © Un (x) 


converge uniformément dans E est que, pour tout nombre 
e > O ,on puisse déterminer un entier no = no (<), tel 
que, dès que n > no et p > O (n et p entiers), on ait : 


[Un + 1 (X) + Un+e (x) + Un+3 (X) + + 
Un+p (X)|<E 


ce, quel que soitxe E. 


[.G.D.A. 
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Dans les applications courantes, on utilise souvent 
le critère suivant, qui est une condition suffisante : la 


Le] 
série © Un (x) est uniformément convergente dans E 


Lee] 
s'il existe une série numérique 2 an, à termes positifs, 


convergente et telle que l'inégalité [u, (x)| < a» soit 


vérifiée pour tout x € E. 


Rs 2 er QIX : 
Ainsi, la série de terme général D — Un (x) est uni- 


formément convergente dans R tout entier, puisque 


[sin x| < 1, donc que [u, (x)| < cette dernière série 


1 
= Dr’ 
convergeant en raison du critère de Cauchy énoncé plus 
haut. 

D'un théorème très classique (dit de la double 
limite) concernant les suites de fonctions, on déduit 
— entre autres — le résultat suivant : la somme d'une série 
de fonctions continues sur l'ensemble fermé E, uniformé- 
ment convergente dans E, est une fonction continue sur E. 

De même, les théorèmes suivants mettent en valeur 
l'importance de la notion de convergence uniforme : 

— intégration terme à terme; si, pour toutes les 
valeurs entières de k (k = 0,1,2,..),ux (x) est une 
fonction réelle définie sur l'intervalle fermé [a, b], et 

Le] 
intégrable sur le même intervalle, si la série > ux (x) est 


uniformément convergente dans [a, b] et de somme f (x), 


-b 
alors l'intégrale | f (x) dx existe, la série 
“ «a 


co ( d 
> 4 Î ux (x) dx | 
k=0 | a 

est convergente, et l'on a l'égalité (fig. 27) : 


[ro 2 “a ue (9 ex | 


Le] 
— dérivation terme à terme; si la série Ÿ ux (x) 


converge dans l'intervalle fermé [a, b], sa somme étant 
f (x), si, pourtoutesles valeurs entièresde k (k— 0,1,2,...), 


Le] 
la fonction ux (x) est dérivable, et si la série 3 ur (X) 
des dérivées est uniformément convergente dans le 
même intervalle, alors: 
la fonction f(x) est dérivable sur l'intervalle 
ouvert ]a, b[ 
Le 


F3 u'x (x). 


k=0 


et on a l'égalité : f” (x) = 


Séries entières 


Un cas particulier parmi les séries de fonctions, et 
très utilisé, est constitué par les séries entières où séries 
de puissances. On appelle série entière de la variable x, 
centrée en a, toute série de la forme : 


> Cn (X— a)" = co- 


C1 (X— a) + ca (x— a} + + 
Cn (X— a)? +. 

où Cn (n = 0, 1, 2, ….), a et x sont, de la façon la plus 

générale, des nombres complexes. En particulier, lorsque 

a — O (série centrée à l'origine), la série entière prend la 

La 

forme > CnX® = Co + C1X + Cox? + 

n=0 : 

Toute série entière est convergente en son centre; il 

existe des séries entières qui convergent dans tout le plan 


x" * 
%) d'autres 
n} 


+ CnXT + 


Lee] 

complexe (ans la série exponentielle > 
n=0 

qui convergent en certains points et seulement en ceux-là 
(par exemple, la série géométrique convergente à l'inté- 
rieur du disque unité |x| < 1), d'autres enfin qui ne 


[2e] 
convergent qu'au centre (va exemple, la série si n! x) 
n=0 


On montre que, lorsqu'une série entière converge en 
d'autres points que son centre — mais sans converger 
dans le plan complexe tout entier —, alors il existe un 
cercle, appelé cercle de convergence, centré au point a, 
tel que la série converge en tout point x intérieur à ce 
cercle et diverge en tout point extérieur à ce cercle (fig. 28). 
Le rayon de ce cercle est dit rayon de convergence de 
la série. Sur les points de la circonférence, le comporte- 
ment de la série ne peut être établi de façon générale : 
il varie selon les cas. Une série entière qui converge dans 
tout le plan est dite avoir un rayon de convergence infini, 
tandis qu'une série entière ne convergeant qu'en son 
centre a un rayon de convergence nul. 

La propriété essentielle du cercle de convergence 
d'une série entière est que cette série converge unifor- 
mément dans tout disque fermé de même centre et de 
rayon strictement plus petit que le rayon de convergence. 
Il y a même convergence absolue de la série en tout point 
situé à l’intérieur du cercle de convergence. 

Le rayon de convergence dépend de la suite des coef- 
ficients c», en fait de la suite de leurs modules |c2|. 
Son calcul s'effectue selon la classique relation de Hada- 
mard : 

1 " RTE 
ee lim sup *\|Cx| 
n— © 
dans laquelle sont inclus, avec une interprétation évidente, 
le cas où R = O0 et le cas où R = 00. 

A l'intérieur du cercle de convergence, on peut aussi 
bien dériver terme à terme qu'intégrer terme à terme une 
série entière. La série des dérivées et la série des primitives 
ont d'ailleurs le même rayon de convergence. 

L'étude des séries entières de rayon de convergence 
non nul a permis à K. Weierstrass de développer l'étude de 
la théorie des fonctions analytiques de variable complexe. 

D'autres types de séries de fonctions ont une utilisa- 
tion courante, tant en analyse mathématique que dans ses 
applications : les séries trigonométriques, dont on parlera 
plus loin pour les développements de fonctions en série 
de Fourier; les développements en série de fonctions 
orthogonales; les séries de Dirichlet, particulièrement 
intéressantes dans les récents développements de la 
théorie analytique des nombres; où encore les séries de 
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Laurent, à la base de la théorie des fonctions de variable 
complexe, pour ne citer que les plus classiques. 


Équations différentielles 


Il arrive souvent qu'à l'occasion de problèmes (géo- 
métriques, physiques, etc.} dans lesquels interviennent une 
variable indépendante x et une variable y dépendant de x, 
on ait à considérer — en vue de la solution — une équa- 
tion liant x, y et ses dérivées (par rapport à x) y’, y”, …, y() 
jusqu'à un certain ordre n: 


o (X y, Y,…, y®) = O0. 


De l'étude de cette relation, on se propose de déduire 
le maximum possible d'informations sur la dépendance 
de y selon x, plus précisément de déterminer la fonction 
y = y (x) qui vérifie, quelle que soit la valeur prise par x 
dans un certain intervalle, l'équation : 


o (x, y (x), y’ (x), …, y) (x)) = 0. 


L'équation © (x, y, y’, …, y®)) = O s'appelle équation 
différentielle d'ordre n; n est ici le plus grand ordre de 
dérivation parmi les dérivées figurant effectivement dans 
l'équation (par exemple, x2y‘” — e% . y’ + (log x) y = 0 
est une équation différentielle d'ordre 3). 

Lorsqu'il est possible de transformer l'équation de 
telle sorte que l’on puisse résoudre par rapport à (c'est-à- 
dire isoler) la dérivée de plus grand ordre, l'équation 
obtenue : y(®) = F (x, y, y’, …, y 1) est dite écrite 
sous sa « forme normale »: il est évident que dans cer- 
tains cas, une équation différentielle donne lieu à plusieurs 
« formes normales » : 
par exemple, l'équation 


F 
peut s’écrire sous les deux formes normales 


1112 


— xy  +ez = 0 


va = y et)1/2 ou y"! a (xy'— et)1/2, 


Résoudre une équation différentielle signifie rechercher 
l'ensemble de toutes les fonctions y (x) vérifiant l'équa- 
tion donnée. Dans le cas le plus général, on peut dire que 


« Famille de solutions 
d'équation différentielle 
du premier degré. 


Richard Colin 


A Figure 29 : famille des solutions (y = Cx?) de l'équation xy’ = 2 y. 
Figure 30 : famille des solutions (y = x Log ix| + Cx) de l'équation xy’ = x + y. 
Figure 31 : famille des solutions (xy = C) 
de l'équation xy’ = — y avec pour C = 0, {x = 0, y = 0}. 
+ 


Figure 32 : famille des solutions (r = Ce®) de l'équation y = rome 
avec x = rCOSe,y = rsins. 
Figure 33 : famille des solutions (x? + y? = C) de l'équation yy' = — x. 
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lorsqu'une équation différentielle d'ordre n possède des 
solutions, celles-ci sont définies implicitement par une 
famille d'équations du type F (x, y, c1, C2, …, Cn) = 0, et 
le théorème des fonctions implicites permet de 
conclure à l'existence d’un ou plusieurs systèmes de fonc- 
tions y — y (X; C1, C2, C3, …, Cn), chacune dépendant en 
fait de n paramètres arbitraires. 

En adoptant un langage inspiré de considérations à 
caractère géométrique, on appellera courbe intégrale 
de l'équation une telle famille de solutions; en effet, 
on pourrait construire (par dérivation et élimination de 
paramètres) une équation différentielle d'ordre m, à 
partir d'une famille de courbes © (x, y; a1, &2, …, am) = 0 
dépendant effectivement de m paramètres. Par exemple, 
en partant de la famille des cercles de rayon r fixe et de 
centre (a, b) variable dans le plan : 


(xX— a + (y—b}— "= 0 


on obtient en dérivant deux fois (autant de fois que de 
paramètres) : 


(X— a) + (y—b)y =0 
puis 1+y?+ (y—b)y"=0 


et l'élimination des paramètres a, b entre ces trois équa- 
tions donne l'équation différentielle du second ordre : 


(Le Pre = 0 


qui admet comme système de courbes intégrales la 
famille (doublement infinie) des cercles © (x, y: a, b) = 0 
de laquelle nous sommes partis, et qui dépend de deux 
paramètres arbitraires. 

L'équation F (x, y; c1, c2, …, Cn) — 0 s'appelle l'inté- 
grale générale de l'équation, et pour un n-uplet parti- 
culier de constantes : c1, C2, …, Cn, On obtient 

F (x, y; C1, C2, …, Cn) que l’on appelle une 
intégrale particulière ; les intégrales singulières sont, elles, 
des fonctions y = y (x) vérifiant l'équation différentielle 
mais ne pouvant être considérées comme des cas parti- 
culiers de l'intégrale générale. 

L'expression exacte de l'intégrale générale par des 
opérations et fonctions usuelles est réalisable, à un niveau 
élémentaire, uniquement pour quelques types parti- 
culiers d'équations, présentées plus loin. Naturellement, 
dès que l'on dispose de notions et d'instruments d'analyse 
mathématique plus « sophistiqués », la classe des équa- 
tions différentielles résolubles (au sens indiqué) s'élargit 
beaucoup. 

Dans les autres cas, et selon les contraintes du pro- 
blème pratique de départ, avant de rechercher l’ensemble 
de toutes les solutions, on essaie de trouver une solution 
particulière possédant les propriétés demandées par le 
problème particulier qui est examiné : ces propriétés 
peuvent avoir trait au comportement de la solution 
particulière en un point, par exemple aux « conditions 
initiales »; la détermination d'une solution vérifiant un 
système donné de conditions initiales est désignée sous 
le nom de « problème de Cauchy ». D'autres fois, les 
conditions restrictives peuvent être relatives à des points 
divers, et l'on dit alors que l'on a un « problème aux 
limites ». 


Types simples d'équations du premier ordre 

Parmi les équations du premier ordre (fig. 29, 30, 31, 
32 et 33), on distinguera les suivantes : 

e Les équations à variables séparées ou séparables, que 
l'on peut donc mettre sous la forme A (x) dx = B (y) dy, 
qui donnent alors |A (x) dx = | B (y) dy + c pour 
intégrale générale. 

e Les équations différentielles exactes, de la forme 
A (x y) dx + B (x, y) dy = 0 où le premier membre est 
la différentielle exacte d'une certaine « fonction potentiel » 
U (x, y); il faut donc que 


CA ©B 
y (x y) = ax (x y} 


et U (x, y) = c est alors l'intégrale générale. 


e Les équations homogènes, qui s'écrivent y’ = f (2). 
d 
où y — _. la transformation y — t * x 


(donc dy = t: dx + xdt) 
ramène alors ce type d'équation au type précédent. 


e Les équations linéaires, de la forme 
y'=A (x y +B (x. 
L'intégrale générale de cette équation s'obtient en ajou- 


tant à une solution particulière l'intégrale générale de 
l'équation homogène y’ — A (x) y associée, et s'écrit 


sous la forme : 
y = exp ([ À (x) dx) + [B (x) exp (—J À (9 dx + c)]: 


la méthode utilisée est celle de la « variation de la cons- 
tante ». 

e Les équations de Bernouilli : y! — A (x) y + B (x) y’, 
où r est un nombre réel non nul et différent de 1. 


al. 
zi-T.7 
S ) 


; 1 
La substitution y = z/17 (donc y’ = = 


transforme l'équation donnée en une équation différen- 
tielle linéaire, du type précédent, de la variable z = z (x); 
© Les équations de Riccati : 


y'= A (GX) y?+B (2 y +C (x). 


La résolution présuppose la connaissance d'une solution 


: 1 
particulière © (x); la transformation y = © (x) — - 
Z 


ramène alors l'équation donnée à une équation différen- 
tielle linéaire relativement à z — z (x). 

Dans les quatre derniers types d'équations, il s'agissait 
d'équations résolues par rapport à y’; les deux suivantes 
sont, par contre, des cas que l'on ne peut mettre sous forme 
normale. 


e l'équation de Lagrange : | 
y = xA (y) + B (y [B (y) # y]. 
En posant y’ = t — t (x), on obtient y = xA (t) + B (#); 
en dérivant, il vientt= A (t) + xA’ (t)-t’ + B’ (6): f’avec 
= d'où l'équation linéaire de la variable x = x (é) : 


dx A’ (t)  _B’ 6 
Œ 1-40 “FAO 


e L'équation de Clairaut : y = xy' — A (y’). On pose | 
y’ = t et on obtient l'intégrale générale y — cx + A (c). 
e Ê sms [X=— A (# 
Intégrale singulière : y=tx+ À (t) que 
simplement en dérivant l'équation de départ par rapport 
à X. 


l'on obtient 


Types simples d'équations du second ordre 


@e Dans les équations de la forme F (x, y’, y”) — O, 
on pose y’ = {= t (x) donc y” — #’. Ceci ramène l'équa- 
tion à une équation du premier ordre relativement à t 
de laquelle résulte l'intégrale © (x, t, c1) — 0; par consé- 
quent, on a de nouveau une équation du premier ordre 
@ (x, y’, c1) = 0 de laquelle on déduit l'intégrale générale 
1 (XV: C1, Ce) = 0. 

@e Dans les équations de la forme F (y, y’, y”) = 0 

: PR SU. LE 
on tient compte de l'égalité y” — de - y” pour considérer 
la transformation y’ = t (y). On obtient alors une équa- 
tion du premier ordre : F (y,t,t’:t) — O dont l'intégrale 
générale a la forme © (y, t; c1) — 0. Puis de cette nouvelle 
équation différentielle du premier ordre © (y, y’; ci) = 0, 
on obtient l'intégrale générale cherchée sous la forme : 


F(X y; C1, C2) = 0 (fig. 34, 35, 36 et 37). 
Équations différentielles linéaires d’ordre n L 
Il s'agit d'équations de la forme : 


À Figure 34 : les deux premières fonctions de Bessel Jo (x) et Ji (x), 
Po (x) y® + p1 (x) y@ D + + px (x) y = A (x) : TRS PL RE ( 2) 
solutions de l'équation : y + =y + |[1——|)y=0 pour, = 0ety=1. 
où les fonctions p; (x), (= 1,2,..,n) et A (x) sont ae É 
continues dans un intervalle [a, b], avec de plus p, (x) £ 0 
pour tout xe [a, b]. Lorsque le second membre A (x)  NMy/(x) = SRE 
n'est pas identiquement nul sur [a, b], on dit que l’équa- , 1; NES _ = 
tion est complète, et si À (x) — O sur [a, b], on dit que lo . dé 
l'on a une équation homogène. 
La linéarité du premier membre, relativement à 
La (x) = 8 + Ja (ix). 


“ (2) 
5 De ss: Figure 37 : les deux premières fonctions de Kelvin Ko (x) et K1 (x) 
entraîne que, si o1 (x), 02 (x), …, ox (x) représentent des R [nr (x) — In (x) 


solutions quelconques de l'équation homogène (c'est-à- EL 7. sinnz ROUEN UMR SE 


Figure 35 : les deux premières fonctions de von Neumann, définies par 
cos vr * Ju (x) — Jo (x), Z 
© ————<— y 


Figure 36 : les fonctions l (x) et I: (x), solutions de X?y” + xy’ + (x2+ n°) y = 0 
pour n = 0etn = 71, sont liées aux fonctions de Bessel Jo (x) et Ji (x) par 
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dire sans second membre), alors toute combinaison 
linéaire de ces solutions, 

y (x) = c1 o1 (x) + ce ge (x) + … + Cr @x (x) 
(où les c; sont des constantes) est encore solution de la 
même équation homogène. 

On montre que l'ensemble des solutions d'une équa- 
tion différentielle linéaire d'ordre n forme, pour les opé- 
rations usuelles d’addition et de produit par une constante, 
un espace vectoriel de dimension finie n. |l est donc suffi- 
sant, pour construire l'intégrale générale d'une telle 
équation, de déterminer exactement » solutions linéaire- 
ment indépendantes, puisque celles-ci forment alors une 
base de l'espace des solutions : on dit que l'on a un sys- 
tème fondamental de solutions : 61 (x), o2 (X), …, on (x); 
la famille des fonctions c1œ1 (x) + C292 (X) + .… + Cn®n (x) 
dépendant des n paramètres c1, C2, …, cn est alors l'inté- 
grale générale de l'équation homogène donnée. 

Dans le cas des équations différentielles linéaires com- 
plètes, on montre que l'intégrale générale s'obtient en 
ajoutant à une intégrale particulière y* (x) la solution 
générale de l'équation linéaire homogène associée 
(c'est-à-dire où l’on a remplacé le second membre A (x) 
par 0) ; donc: 


y = y* (x) + cioz (x) + cage (x) + … + Cnpn (x). 
Un cas particulier très intéressant et fréquemment 


rencontré est celui des équations différentielles linéaires à 
coefficients constants : 


20ÿ + ay D + + any = Q (x) 


40, 41, ……, An étant des constantes. On considère l'équa- 
tion homogène associée : 


a0y (0) + a1y® D +. + any = 0. 


La recherche d'un système fondamental de solutions, 
dans ce cas, conduit à la résolution de l'équation algé- 
brique, dite équation caractéristique : 


aor? + art -l—... + an = 0 


où les coefficients a; sont les mêmes que dans l'équa- 
tion proposée, et r l'inconnue. 

Dans le domaine complexe €, une telle équation 
admet (théorème de D’Alembert-Gauss) n racines 
lie 2 mu ln; les fonctions exp (rxx) (k = 1,2,.., n) sont 
des intégrales de l'équation différentielle homogène, 
puisque : 

[exp (r#x)](P) = rx? exp (rrx). 


Si les racines 74 sont toutes distinctes, les n intégrales 
particulières e’x? (k — 1,2, n) constituent un système 
fondamental de solutions, et, par suite, l'intégrale générale 
qui en résulte est : 


y = CieiT + Coef2T + …. + Crefnt 


OÙ C1, C2, …, Cn Sont des constantes arbitraires. 

Si l’une des racines 7 est multiple et si m (< n) désigne 
son ordre de multiplicité, alors la suite (le m-uple) de 
solutions : 

et, xeTt, x2ert, …, XMETT 


forme un système linéairement indépendant, qui, réuni 
avec les n— m racines distinctes restantes, constitue 
un système fondamental de solutions, et l'intégrale géné- 
rale cherchée est combinaison linéaire des éléments de 
ce système. 

Lorsque l’on est dans le cas où l'équation caractéris- 
tique admet des racines complexes, bien que les coeffi- 
cients a; soient réels, on remarque que pour toute racine 
complexe r = « + 8, le nombre complexe conjugué 
F = à — 8 est aussi racine, de telle sorte que, par combi- 
naison linéaire appropriée des deux solutions e(x+?6)z 
et e(x—?9)7, et grâce aux formules d'Euler (voir Trigono- 
métrie), on obtienne les deux solutions particulières 
réelles : 

ex? cos 8x et ezz sin 8x. 


Équations aux dérivées partielles 


Lorsque la fonction inconnue est une fonction de deux 
ou plusieurs variables indépendantes, l'équation qui lie la 
fonction à ses dérivées, donc en fait les dérivées partielles, 
jusqu'à l'ordre n, s'appelle équation aux dérivées partielles 
d'ordre n. Ces équations sont fondamentales, par exemple 
en physique mathématique, en physique théorique (où les 
problèmes traités admettent usuellement le temps et les 
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coordonnées d'un point arbitraire comme variables indé- 
pendantes), en économie mathématique, etc. 

La résolution de ces équations est, en général, délicate 
et complexe. Après avoir posé le problème et quelques 
considérations de base, nous examinerons ici quelques 
équations classiques. 

e Les équations aux dérivées partielles du premier 
ordre, pour des fonctions de deux variables indépendantes, 
se présentent sous la forme : 


Or, il est à constater que, lors d'une dérivation partielle, 
comme pour une constante additive, on a « disparition » 
de tout ce qui est fonction de l’autre variable (par exemple, 


: ê PRE 
siz=y?—Y% (0, on a À = 2 y); on voit là le moyen 


d'obtenir une équation aux dérivées partielles par diffé- 
rence d'équations différentielles classiques au moyen 
d'une élimination appropriée de fonctions arbitraires. Les 
solutions d'équations aux dérivées partielles contiendront 
donc des fonctions arbitraires, de même que les solutions 
d'équations différentielles contiennent des constantes 
arbitraires. 

Ainsi, l'équation aux dérivées partielles du premier 
ordre, linéaire, s'écrit : 


©z oz 
A Gy TE + B ES LESS C (x, y, 2) 


où À, B, C, sont des fonctions données [une telle équa- 
tion pourrait être obtenue de l'équation # (u, v) = 0, où 
u—=u(x,y,z) et v = v (x, y, z), en éliminant la fonction 
arbitraire o]. 

e Parmi les équations aux dérivées partielles d'ordre 
supérieur à 1, fréquemment utilisées dans tous les domai- 
nes de la physique, on peut distinguer : 

— L'équation des cordes vibrantes : 


où t représente le temps; la corde élastique homogène est 
tendue entre les points (0, O0) et (/, 0) de l'axe x, vibrant 
ensuite dans le plan Oxy; l'abscisse d'un point de la 
corde x détermine au temps { son ordonnée y = y (x, ét); 
enfin a? est une constante liée aux caractéristiques physi- 
ques de la corde. 

Le changement de variable x + at=u, x—at=v 


= 0, que l'on 


ë ; 2 e?y 
transforme l'équation de départ en ET 


résout : 


ê à Pe 

7, = f1 (u), où f1 est arbitraire, 

êu 

soit y = f (u) + g (v), où f est une primitive de 1 et g 
une fonction arbitraire. D'où la solution générale de 
l'équation : 


y (X t) = f(x + at) + g (x— at) 


où et g sont deux fonctions (continûment différentiables) 
deux fois arbitraires. Il est aisé de donner un aspect 
physique à cette intégrale générale si l’on remarque que la 
constante a peut s'interpréter comme une vitesse de pro- 
pagation des ondes. 

Le problème de Cauchy, qui correspond aux conditions 
initiales 

yo (x) = y (x, 0), forme de la corde à l'instant initial; 


I 


y1 (x) = (x, 0), vitesse le long de la corde à l'ins- 


tant initial; 
admet une solution unique : 


at) + yo (x— at) | 


1 pr+a 
T 2a ] 

La résolution de cette équation permet de discuter de 
nombreux problèmes physiques tels que ceux posés par 
des vibrations longitudinales ou par des tuyaux sonores. 

— Equation de Laplace : 


y 0 = | y (x + 


Y1 (u) du 


z — at 


La fonction V (x, y, z) — où (x, y, z) désigne un point 
quelconque de l'espace — admet comme interprétations 
physiques les suivantes : 

potentiel de gravitation en milieu privé de points 
matériels ; 

potentiel électrique dans un diélectrique uniforme; 

potentiel magnétique, etc. 


— Équation de Poisson : 


2 2 2 
F SRARR RNA 


où f (x, y, z) est une fonction donnée, définie par le pro- 
blème concret. 
Ici V peut être interprété comme : 
potentiel de gravitation dans un milieu où f (x, y, z) 
est proportionnel à la densité de matière; 
potentiel électrostatique dans un milieu où f (x, y, z) 
est proportionnel à la distribution des charges, etc. 


— Équation de la chaleur : 
BV BV, EV 1 


où V représente la température à l'instant £{ du point 
(x, y, z) d'un corps homogène isotrope, et k une cons- 
tante de diffusion, caractéristique du matériau. Lorsque 


£ ’ êV = 
la température est stationnaire, alors Fe 0, et l'on 


retrouve l'équation de Laplace. 
Dans le cas de l'équation, dite simplifiée : Ca = de 
; : "x? © 
on montre que, pour toute fonction f (u) suffisamment 
régulière, on a la solution : 


+ co 1 — (x— u} ; 
LL 2 jure FE f (u) du 


Le problème de Cauchy, correspondant à la condition 
initiale Vo (x) = V (x, O0), admet la solution : 


Gr (x t) = | 


œo 1 ns at 
vue [PE 0 Es + Vo (u) du 


— Équation des ondes : 
O2V ENV , EU 1 G2V 
EX?  Cy? 672 oc? ét? 
où cest la vitesse de propagation de l'onde. 
Ses applications sont bien connues en théories électro- 
magnétiques. Dans le cas monodimensionnel, on retrouve 


l'équation des cordes vibrantes. 
— Equation de Schrüdinger : 


où m désigne la masse d'une particule dotée de l'énergie 
totale W, V étant son énergie potentielle, et À la constante 
de Planck. Cette équation intervient en mécanique quan- 
tique. 


Fonctions de variable complexe 


L'étude des séries entières est, historiquement, à l'ori- 
gine du développement de l'analyse par les fonctions 
de variable complexe; c'est d'abord une extension du 
cadre des fonctions analytiques (d'où résultent le concept 
essentiel de dérivation complexe et celui de fonction 
holomorphe), puis l'étude plus générale menée à l'aide 
de l'intégrale curviligne : on aborde alors tous les 
problèmes de primitives. La recherche de solutions glo- 
bales, étendant les résultats locaux obtenus par la théorie 
de Cauchy, débouche alors rapidement sur des problèmes 
de géométrie et de topologie algébrique. 

Sur un plan très pratique, l'un des aboutissements 
de la théorie de Cauchy est le théorème des résidus 
qui est continuellement utilisé en calcul intégral; il n'est 
pas exagéré de dire qu'il s'agit d'un des outils mathéma- 
tiques indispensables à la physique classique. 

Loin d'être épuisé, le sujet fait encore l'objet de très 
nombreuses recherches en liaison étroite avec les résul- 
tats acquis en topologie algébrique. 


Fonctions holomorphes 


La dérivation des fonctions de variable complexe est, 
comme dans le cas réel, l'outil de base de l'analyse. Mais 
la différence est grande, et le concept de dérivée par rap- 
port à la variable complexe z = x + jy est particulière- 
ment puissant, puisque en fait il recouvre beaucoup plus 


<« Relief 
de la fonction elliptique : 
dn (u) = Vi— KSN: (u). 


Palais de la Découverte - Paris 
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Richard Colin 


A Figure 38 : exemple 
de courbe rectifiable. 


Y Figure 39 : 
notion d'homotopie. 


Richard Colin 


complètement que dans le cas réel l'approximation des 
valeurs prises par une fonction au voisinage d'un point. 
La formule de Taylor, 


2 


f(a+h)=f(e) + hf(a) +À F”(a) +. + 


hr +1 
(n +1)! 


exprimée pour les fonctions réelles d'une variable réelle, 
permet cette approximation qui est d'autant plus précise 
que la fonction est à un ordre élevé continûment dérivable. 

Mais, malgré ces conditions restrictives, il est aisé de 
trouver des fonctions « assez régulières » qui ne coinci- 
dent pas avec leur développement de Taylor : 


hr 
TG) + Ra 


œ 
1 
Pa FT: FR) (xo) + (X — xo)? 


autour d’un point xo donné ; par exemple, la fonction défi- 
nie sur R par : 


f (x) = exp 
f(0) = 0 


dont la série de Taylor au point xo = 0 a tous ses coeffi- 
cients nuls et converge donc, mais n'est égale à f qu'au 
seul point xo = ©. 

On dit qu'une fonction est analytique sur un ouvert 
U & R, si elle est égale à son développement de Taylor 
au point xo, au voisinage de tout point xo € U. Il en est 
ainsi de multiples fonctions usuelles : logarithme, expo- 
nentielle, fonctions trigonométriques circulaires ou hyper- 


(-5 six 0 
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boliques, etc. La classe de ces fonctions va se révéler 
plus aisée à déterminer dès que l'on s'intéressera aux 
variables complexes. 

Si donc f:Q —+C, où Q est un ouvert de €, est une 
fonction de variable complexe, on dit que f est dérivable 
ena € Q si l'expression 


lim f(a+ h)—f(a) 


existe, 
h—0 h 


(on la note f’ (a)) en posant h — h1 + ihe, tel que h 
tend vers zéro si et seulement si A1 et A2 (réels) tendent 
vers zéro. On dira que f est dérivable ou encore holo- 
morphe sur Q, si ceci est vrai en tout point a € Q. Les 
conditions de Cauchy-Riemann sont des conditions 
nécessaires et suffisantes d'holomorphie. Si l'on décom- 
pose f(z) = f(x + iy) = P (x y) +Q (x y), comme 
tout nombre complexe, en partie réelle et partie imaginaire, 
elles s'écrivent : 
OP: 00. &P Ce) 
ëx  êy’ y 8x 

Bien entendu, comme pour les fonctions réelles, déri- 
vables, d'une variable réelle, la somme et le produit de 
fonctions holomorphes, l'inverse d'une fonction holo- 
morphe non nulle sont holomorphes; le produit de com- 
position — lorsqu'il est licite (f:Q — G et g: GC 
ont un produit de composition g of: (Q — C) — de deux 
fonctions holomorphes est holomorphe. Dans tous les 
cas, les formules usuelles de dérivation se transcrivent 
sans modification. 

Si l’on définit, pour z = x + jy et une fonction f (z), 
les dérivées : 


RTE &f 1/@f  .of 
êx ) ( ) 


ë&z 2 

qui se justifient par le fait que : 
dz = dx + idy 
dz = dx — idy 


x "7 


ëz 2 


donc que : 
1 ; 1 =: 
dx = 3 (dz + dz) et dy = 7j (dz — di), 


donc aussi que : 


df = : dz + di puisque df = _ dx + 2 
alors la fonction f est holomorphe si et seulement si on a 
êf 
De 


La fonction z > z est holomorphe, donc les polynômes 
et les fractions rationnelles (en dehors de leurs pôles, 
c'est-à-dire des points où s’annule le dénominateur) 


ee à œ 
sont holomorphes. Pour une série entière anz?, ayant 
un rayon de convergence égal à R (qui peut aussi être 


a 
infini), la fonction z + > anz? qu'elle définit est Ao/o- 


morphe à l'intérieur du disque de convergence, c'est-à- 
dire pour tout ze C tel que[z| <R. 
Par suite, les fonctions 


n 
ze? — >. = 
0 | 
Fe a z@n+1) 
verse 2, CP EEEN 
D, z2n 
Z = COS Z = — 1) = — 
| 2, À ) (2 n)! 


sont holomorphes dans le plan complexe tout entier. 

Par contre, les fonctions z > Z, où encore z + arg z, 
ne sont pas holomorphes. 

La notion d'holomorphie, apparemment identique à 
celle de dérivabilité pour les fonctions réelles d'une varia- 
ble réelle, est en fait beaucoup plus riche, et par consé- 
quent est un concept mathématique très fort. 


Intégrales curvilignes — Théorie de Cauchy 
Pour tout segment [a, b] & R et toute application 
continue ©: [a, b] + €, on appelle courbe le couple 
formé par l'application ® et son image © ([a, b]), soit 
T' = {o ([a, b]), o}. On dit que cette courbe est conti- 
nûment différentiable par morceaux si l'application 
possède cette propriété. On donne le nom de paramétrage 
de Là ©. Pour une même courbe T’, on peut envisager des 
paramétrages distincts; toutefois, deux paramétrages 9 
et Ÿ de classe C? seront dits équivalents : 
[ o: [a 8] + C 
| F:[a,b1 +C 
pourvu qu'il existe une application À : [«, 8] — [a, b], 
bijective, strictement croissante, de classe C* telle que : 
®— Ÿoh, avec de plus h’ (t) Æ O pour toutte [x, 8]. 
Ajoutons enfin que, lorsque la fonction de paramétrage 
o est telle que, pour toute division 


a=to<ti<to<… <tn=b 


n 
de l'intervalle [a, b], on a n: lo (ti) — © (t-1)| < Ce 
i=1 
où C4 est une constante qui ne dépend que de © et non 
pas du partage |#:| — on dit que w est à variation bornée — 
la courbe T' est dite rectifiable (fig. 38). 


n 
Dans ce cas, 3 lo (t)—® (ti -1)| = Li} (o) repré- 
i=1 
sente la longueur de la ligne polygonale inscrite dans 
définie par les points Mi (= 1,2, n) de la courbe, 
d'abscisse &; (i = 1,2, …, n). Le pas du partage {t:} étant 
défini naturellement par à (P) = sup Îé —t-1l (c'est 


i 

donc to — t1 dans le cas de figure), si Li: (o) admetune 
limite lorsque à (P) 0, cette limite est, bien sûr, la 
longueur de la courbe : 


b rb 
longueur I — Î |d o(t)| = | lo’ (#)| dt 
(4 
de n 
= sup D le &)—e (&-1)l. 
partage {ti} ; =" 
Le dernier terme est appelé variation de ©. 
Si f est une application d'un ouvert Q € C, dans €, 
continue, et si L' est une courbe paramétrée par ® et 
b 


[a, b], d'image y, alors l'expression [ flo (6)] do (€) 


est invariante dans tout changement de paramétrage à 
l'intérieur de la classe des paramètres équivalents; on la 


désigne par la notation [ f (z) dz. En particulier, la 


p 


longueur de y se note | |dz|. 
“ 


C'est alors tout le problème des primitives, au sens 
complexe, que l'on peut poser à l'aide des notions de 
lacet et d'homotopie (fig. 39), et d'où on peut alors 
faire ressortir le caractère très particulier des fonctions 
holomorphes. 

Un /acet est un chemin, c'est-à-dire une application 
y:l= [ab] +C, dont les extrémités sont égales : 
y (a) = y (b). Lorsque l'application y est constante, le 
lacet est dit constant; sa trajectoire est réduite à un point. 
Deux lacets y1 et 2, contenus dans un ouvert U du plan C, 
sont dits homotopes si l’on peut construire une application 
hill x 1 C vérifiant : 

h (t, a) = y1 (t) pourtouttel 

h ( b) = y2 (6) 

h (a, u) = h (b,u) pourtoutuel 
h est donc une « déformation » continue permettant de 
« passer » de Y1 à y2. 

Un ouvert U & C est dit simplement connexe lorsque 
tout lacet y de U est homotope dans U à un lacet cons- 
tant (ou homotope à un point). 

Le théorème de Cauchy exprime alors que, pour une 
fonction f : U —> C, holomorphe dans un ouvert U sim- 
plement connexe, l'intégrale de f le long de tout lacet 
de U est nulle : 

[ f (2) d= 0. 
Fe 


Ÿ 


Plus généralement, si y1 et ÿ2 sont deux lacets homo- 
topes d’un ouvert U & € quelconque, pour toute fonc- 
tion f: U — C, holomorphe dans U, on a: 


f (z) dz = Î f (z) az. 
Ji Y2 

Cette intégrale ne dépend donc que de la classe d'homo- 
topie du contour d'intégration (voir Courbes et surfaces). 

La conséquence est que toute fonction holomorphe dans 
un ouvert y admet localement une primitive qui est aussi 
holomorphe: c'est-à-dire que, pour tout point de cet 
ouvert, on peut déterminer un voisinage de ce point dans 
lequel la fonction admet une primitive, qui est holomorphe. 

Ce théorème permet d'établir la formule intégrale de 
Cauchy. Celle-ci montre que, à l'intérieur (dans un sens 
qu'il convient de préciser) d'un chemin fermé de C, 
le comportement d'une fonction holomorphe (dans un 
ouvert contenant ce chemin) est déterminé par son com- 
portement le long du chemin, uniquement. 

L'indice d'un point zo par rapport à une courbe fermée y 
se définit par la formule : 


fl 
re = 75] 


dz 
y Z— 20 
et l’on peut montrer qu'il s'agit d'un entier relatif, qui n'est 
pas modifié lorsque le chemin y se déforme continûment, 
mais sans passer par zo. De plus, dans chaque composante 
connexe du complémentaire de l’image de Y, le point z 
peut se déplacer sans altérer la valeur de | (Y, zo). 

Un calcul simple dans le cas où y est un cercle permet 
alors de conclure de tout ceci que le nombre | (y, zo) 
représente en fait la notion intuitive du nombre de fois où 
la courbe y « tourne autour » du point zo (fig. 40). 

C'est en ce sens que la notion d'un point intérieur à 
un chemin fermé se trouve précisée, et la formule de 
Cauchy s'écrit alors pour un chemin fermé y d'un ouvert 
simplement connexe U & C, une fonction f holomorphe 
dans Ü et un point a € Ü tel que y ne passe pas par a: 

1 Fr 12) 2 
la): = Fi —— 


Ti J 


Il existe une réciproque au théorème de Cauchy, le 
théorème de Morera toute fonction continue 
f: D + C, où D est un ouvert de C, telle que 


f (2) 42=:0 
— si y est un rectangle fermé contenu dans D — est 
holomorphe dans D. 

Mais la théorie de Cauchy permet surtout, à ce point, 
de montrer que toute fonction holomorphe dans un 
ouvert y est analytique. En effet, il suffit de considérer 
la formule de Cauchy, et de remarquer que l'on a: 


— _ L(1 +i+ (+ .— O) + ) si [a] < [z| 


donc on peut écrire : 
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À Le mathématicien 
français 

Augustin-Louis Cauchy 
(1789-1857) est l'auteur 
de méthodes de calcul! 
rigoureuses employées 
encore de nos jours. 


Y Figure 40 : indice 

d'un point par rapport 

à une courbe Y; 

il est donné par le nombre 
de fois où la courbe 
tourne autour du point; 

a, 1 (0, «) = 1; 

b,1(0, x) = 2; 

c, [1 (0, x) = 0. 


F. Arborio Mella 


Richard Colin 


Richard Colin 


À Figure 41 : 
représentation 
de la fonction 

logarithme complexe 
(voir développement 
dans le texte). 


L'interversion des opérations intégration et sommation 

est possible, car la série converge normalement dans le 

domaine fermé défini par y, et l’on obtient bien : 
ce 


1 
f (a) = F3 Cna? où Sr 
n=0 

Toute fonction analytique admet une dérivée, donc, 
pour les fonctions d'une variable complexe les propriétés 
d'holomorphie et d'analycité sont identiques. Ce résultat, 
considérable, implique donc qu'une fonction holomorphe 
est indéfiniment dérivable, donc que la dérivée d'une 
fonction holomorphe est encore holomorphe. Il est donc 
légitime de penser que les propriétés des fonctions holo- 
morphes sont très étendues; on peut citer parmi les plus 
fondamentales celle que donne le théorème de Liou- 
ville : toute fonction entière (c'est-à-dire holomorphe 
dans C tout entier) ne peut être bornée que si elle est 
constante. 

Ce résultat est obtenu à partir des « inégalités de 
Cauchy » qui précisent le comportement des coefficients 
de la série de Taylor d'une fonction , holomorphe dans 
un disque de centre O et de rayon 7: 


M (r) 


rt 


f (2) 


y ZN EL 


az 


|Cn|< (n= 01:22:35) 


si on pose : M — 


Il faut remarquer, d’ailleurs, qu'un résultat connu sous 
le nom de « principe du maximum » entraîne que, 
si M — sup | (z)|, alors on a aussi M = sup |f(z)|; 
lz1=r zl<r 
c'est-à-dire que, si une fonction holomorphe admet un 
maximum relatif (au sens des modules) à l'intérieur d'un 
disque fermé contenu dans le domaine d'holomorphie, 
alors elle est constante dans ce domaine, pourvu que 
celui-ci soit un ouvert connexe. 
Ces trois résultats précisent encore la différence entre 
les fonctions d'une variable réelle et les fonctions d'une 
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variable complexe, tout au moins en ce qui concerne la 
condition de fonction dérivable. 

Signalons, de plus, que le théorème de Liouville permet 
une démonstration très simple du théorème fondamental 
de l'algèbre, le théorème de D'Alembert (voir Équations 
algébriques); en effet, si un polynôme P (z) — qui 
est une fonction entière — n'admettait aucun zéro, 


1 ; - : < ; 
alors 5 serait aussi une fonction entière, et puisque 


lim |P (z)| = + 0, on aurait lim — 0. La fonc- 


ZX Zoo 


1 
P (2) 
tion P entière et bornée serait donc constante. II s'ensuit 


donc par l'absurde que le polynôme P admet un zéro, 
donc n s'il est de degré n, en divisant successivement 
par les monômes (z — ax), ax désignant les zéros succes- 
sifs. 

Sans quitter ce sujet, il faut mentionner un résultat 
qui indique le comportement d'une fonction holomorphe 
au voisinage d'un zéro quelconque et qui est très étroi- 
tement lié au caractère d'analycité de la fonction. Très 
exactement, si f désigne une fonction holomorphe dans 
un ouvert Q € CetaeQ un zéro de f, alors, ou bien 
f est identiquement nulle dans un voisinage de a, ou 
bien a est le seul zéro de f dans un voisinage de a assez 
petit (ce théorème est connu sous le nom de principe 
des zéros isolés). Il ne peut donc exister de point limite 
d'une suite de zéros de f sans que f s’annule partout dans 
un disque ayant ce point pour centre. 

Certaines des propriétés ci-dessus ont un caractère 
« local »; il faut noter que, dans le passage à un résultat 
plus « global », c'est la condition de connexité qui est 
l'hypothèse nécessaire. Ainsi, on peut montrer que, 
si Q € C est un ouvert connexe, l'ensemble des zéros 
d'une fonction holomorphe dans Q est un ensemble 
discret (dont tous les points sont isolés) ou bien Q tout 
entier. 

On montre encore que, si f et g sont deux fonctions 
holomorphes dans un ouvert Q € C, égales sur un sous- 
ensemble E & Q, non discret, alors elles sont égales 
partout sur Q. 


Logarithme complexe 


On sait qu'on peut définir, dans le cadre des fonctions 
de variable réelle, la fonction logarithme comme la réci- 
proque de l'application définie sur R et à valeurs dans 
R, x exp (x), puisque, pour ces deux ensembles 
de départ et d'arrivée, on a une bijection. 

L'extension au cas des fonctions de variable complexe 
est un peu plus délicate. 

En posant, pour tout nombre complexe z = x + jy, 
ez = e?, eÿ — et (cos y + sin y), on définit une 
application z+> exp (z) sur € tout entier. Comme 
exp (27i) = 1,onae#+iy — er+iw+2r); donc,ona 
« périodicité par rapport à la partie imaginaire, de période 
27». Il suffit donc de partager le plan complexe en bandes 
horizontales de largeur 27 pour définir une bijection 
de l’une de ces bandes sur l'ensemble C—4{0} par 
l'application exponentielle complexe; par exemple, 
z— exp (z) — eZ définit une bijection de la bande 
Bo = {ze C tels que O < Imz < 27} sur le plan privé 
de l'origine, ou bien de la bande ouverte 


B_- {ze C tels que |Imz| < 7} 
sur le sous-ensemble 
C—1{ze C tels que Imz = 0 et Rez & 0}, 


soit € privé du demi-axe réel négatif (fg. 41). 

On appelle détermination principale du logarithme de z 
la fonction réciproque de l'application ze de B_+ 
sur € — {demi-axe réel négatif}. On écrira donc 


log z = log |z| +— j arg (z). 


D'autres déterminations du logarithme sont obtenues 
en partant d'une autre bande B+, 4 £ — x. Si l'on note 
D+ le complémentaire, dans ©, de l’image par ez de la 
droite Im z = «, alors e7 définit une bijection de B« 
sur D+, continue; son application réciproque est appelée 
[ & < Im (log z) < a+2r. 


log z, et vérifie : | ee be à 


Séries de Laurent et résidus 

Les séries de Laurent sont un outil qui permet de géné- 
raliser le développement en série entière lorsque l'on est 
en présence d'une fonction holomorphe dans un ouvert, 
sauf en un nombre fini de points. 

Pour une fonction f:Q—€C holomorphe dans Q, 
sauf au point a € Q, on va d'abord étendre la formule de 
Cauchy, puis trouver un développement en série qui ne 
sera plus celui de f dans un disque, mais dans une cou- 
ronne. Une telle extension est faite pour des points 
isolés de Q, c'est-à-dire des points frontières tels qu'on 
puisse trouver pour chacun un voisinage ne contenant 
aucun autre point frontière. Si a désigne un point isolé 
de Q, on cherchera donc à caractériser f dans un disque : 
O < |z— al < r (privé de son centre a); pour plus de 
généralité, on considérera même une couronne 


nm <|z—al <r2. 


La difficulté qui surgit alors est qu'un tel ensemble n'est 
pas simplement connexe. Or, cependant, les deux lacets y1 
et y2 définis par les cercles |z— a] = r1 et |z—a| = 72 
sont homotopes dans Q’, et cela permet donc d'écrire 
que, pour toute fonction g holomorphe dans Q’, si 


Le {a}: fe atids [, g(z)dz (fig. 42). 


En prenant la fonction : 


g (z) = An lorsque t £ z 


g (2) =f (2) lorsque t = z 


qui est bien holomorphe dans la couronne 
Ca = {ze C tels que r1 < [z— al < r2} 


on obtient : 
1 
1Q= 7] 


qui généralise la formule de Cauchy du paragraphe pré- 
cédent. 


f (€) 
ve Î — 2 


dt 


1 Fr _f(t 
ssl. 


Un développement en série de pour |t| = ro uni- 


t— 2 


112 /z\? 
formément convergent dans C4 est pi () .De même, 
5 


un développement en série de mais pour |t| = r1, 


É—Z 
iformé dans C Lee 
uniformément converi nt dans , est: — — =: : 

ge à ; > () 


Ceci permet alors d'obtenir le développement dit « en 
série de Laurent » : 


f()= L Cn (z— a)? = 
=ù : 
b: Cn (z— a) + > Cn (z— a) = 
n=— n=0 
S ET on - Cn° (z— a)? 
n=1 (2— 2)" n=0 
où l'on a: 
tr. Fo 
=) (z— a) +1 de 


y désignant un cercle centré en a, et de rayonr,r1<r<r2 


o 
7 c= 
On peut montrer que la série 2. 7" — est conver- 
n=i (z PT n)® 

gente pour z tel que |z— a] > r1, tandis que la série 
Le] 

1 Cn (z— a) l'est pour z tel que |z— a] < r2. 
n=i 

Il faut noter encore que le développement en série de 
Laurent, une série en puissances de (z— a) et une autre 


a | 


EN! 
CES 


be Q 
KE 


es 


ue 
qu 


TT 
1 


ARS 


en puissances de , est unique dans la couronne Cx. 


1 
(z— a) 

Bien entendu, lorsque f est holomorphe dans Q tout 
entier, on retrouve le développement de Taylor, puisque 
C-n = 0; le point a est dit point régulier. Sinon, le point a 
est dit point singulier; c'est très exactement un pôle 
d'ordre q lorsque c-1 = 0 pour n > q avec cu # 0 
(ainsi, l'origine O est un pôle d'ordre 37 pour la fonction 


ez ; re à ? 
7) et c'est un point singulier essentiel dans les autres cas: 
ainsi l'origine O est un point singulier essentiel pour la 
. eZ 
fonction —. 
z 


. Pour tout point singulier (pôle ou point singulier essen- 
tiel), le coefficient c_1 de la série de Laurent de f porte 
le nom de résidu de f en a que l'on note Rés (f, a): 


Rés (7, a) = c-1= f (2) dz. 


1 
2ri les =r 
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À Point singulier 
de la fonction 


L 
complexe ez 


<« Figure 42 : 
couronne Ca définie 
parri<|z—al<r2. 
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À En haut, figure 43 : théorème des résidus. 


Ci-dessus, figure 44 : voir développement dans le texte-ci-contre. 


Y Figure 45 : l'intégration de la fonction z + e* sur le contour } donne 0 grâce 
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au théorème de Cauchy. 


On peut alors transcrire le théorème de Cauchy pour 
une fonction ayant un nombre fini de points singuliers, et 
obtenir le théorème des résidus : Pour une fonction f : 
Q — C, holomorphe dans Q sauf en un nombre fini de 
points singuliers an (n = 1,2, N), si ÿ est une courbe 
fermée contenue dans Q, ne contenant aucun des 
points an, On a: 


1 


N 


Î fG@)dr= D 1 (yan) - Rés (f an). 


n=i 


Cette formule, qui est bien évidemment une extension 
de la propriété des fonctions holomorphes, s'explique 
en remarquant qu'elle donne la limite de l'action des 
points singuliers sur la valeur de l'intégrale. Plus exacte- 
ment, si c» désigne le cercle de centre a, et de rayon r# 
(choisi pour que les cercles soient disjoints et ne coupent 
pas y), on al (Cr, an) = 0 sin#£ met | (Cr, an) = 1 
(fig. 43). 

Si lon pose : Y’—= Y + &1C1 + … + GnCn avec 
%n = —1(Y,an), on a alors 1 (Y’,ax) = 0 pour 
n = 1,2,.., N. Ce qui permet d'écrire que : 


S 


F f (2) dz = 


[e] 


1 
Zi | 


1 ( » “=N L 
mL rs LG |, de 


n=1 


et il ne suffit plus que d'appliquer la définition du résidu 
de f au point 4». 

Des conditions restrictives sur Q, délicates à expliquer, 
doivent en fait être rajoutées aux hypothèses du théorème ; 
elles sont satisfaites dès lors que ( est un ouvert borné 
et simplement connexe. 

Le théorème des résidus est l'un des outils les plus 
connus pour les calculs d'intégrales impropres (il est 
même parfois utilisé dans la résolution approchée de 
certaines équations). 

En voici quelques exemples : 


sin x 
dx, dont on montre 


»+co 
— Pour le calcul de | 
v -o 


aisément la convergence en intégrant par parties 
sin x 
x 
sur [0,1] après avoir posé f (0) = 1, on a recours à 


(= 


É gp e?z 
l'intégrale | + dz où ÿY = Yr — ÿs avec: 
{ Yr paramétré par Reït 
| ye paramétré par peft pour te [0, r] (fig. 44). 
On applique le théorème de Cauchy : 
Fr eîz ro eîx PT , à . 
0 = — dz = — dx — | eee . jt = 
J+ Z JR À Jo 
R eix PT ” ; ë 
[ — dx + | eine . jdt 
Jp X Jo 
en décomposant sur chaque « partie » de y. 
Puisque : 
re eix FR eix FR sin x 
In || de | 2 dx] = 2 [TX ax 
J-R X X Je X 
et que : 


i FR cmd & , 
lim | eee”. jdt = ir 
2—+0 Jo 


FR Ah à 
eîre . jdt = 0 
Jo 


Dai lim 
insi 
ainsi que D. 


que l'on vérifie aisément, on en déduit que : 


dx=T 


Fe sin x 
J -o 


[La notation Im (A) désigne la partie imaginaire du 
nombre complexe A.] Ë 

— L'intégration de la fonction z + e* surlecontoury 

de la figure 45 donne O grâce au théorème de Cauchy. 


La décomposition de [ e2? dz selon chacun des trois 


Ÿ 


« morceaux » de y, en tenant compte du paramétrage : 


| sur Y1: z = re4 avec0<r<R. 

sur y2: z — Retë avec - < 0 < =. 
| 4 2 
| SUry3:z—/#r avec0<r<R. 


permet à l’aide de majorations classiques de calculer les 
célèbres intégrales de Fresnel : 


f oo loc 
| cos u?du et In 


= 


sin u?du 


qui sont égales toutes deux à Ÿ 


Dans ces deux exemples, on ne fait usage que du théo- 
rème de Cauchy, car les fonctions considérées le permet- 
taient. Les exemples suivants donnent des applications 
de la théorie des résidus. 

dx 
oo (1 + x} 


sur un demi-cercle, situé dans le 


— L'intégrale be se calcule en intégrant 


la foncti : 

a fonction = z$ 
demi-plan supérieur centré à l'origine et dont on fait 
croître indéfiniment le rayon. Cette fonction admet un 
pôle au point — / dans ce domaine. Pour déterminer le 
résidu en ce point, il suffit de faire un changement de 
variable z—t—+ 7j et de chercher un développement 


1 


limité de la fonction TS opt: au voisi- 
{A -z} e(t+-2i? 
nage du point t = ©. 
Par décomposition simple, 
1 A B 
serzm atet0@ 
ce qui donne: 
SRE | | 1. 
Pet+aR 8 #4 |Éé+1 … 
55 
1 —1/ t ’ 
Ba l-3)+00 
Dans cette expression, le coefficient de : égal à _ 
est donc le résidu recherché. 
: F dz 1 Fr : 
Par conséquent | TEE — = 2:r Mn mn Il suffit 


(fig. 46) de décomposer la courbe d'intégration en le 
segment [— R, + R] et le demi-cercle, puis de remarquer 
que, lorsque R co, l'intégrale sur le demi-cercle tend 
vers zéro en module, pour conclure que : 


Fe dx LT 
Jo (1 + (T+ x} NE: 
2 
— Pour calculer F » (Log x dx, on considère la 
(Log 2 


fonction : f (z) = et le contour de la figure 47. 


T1 


Le paramétrage selon les diverses composantes de ce 
contour donne : 


Log x)? 
ess sur [e, R] 
Log x + ir}? 
Corte sur [— R, — €] 
ainsi que : 
(Log R + ;6)? 
1% RE em SUTR 
(Log = + ;6)2 
Tree Se 
: (Log R + 0)? [(Log R}?] 
PRE Tee Ds + 
il s'ensuit que: lim | f(z) dz= 0, 
Ro %ŸR 
de même : lim je f (z) dz = 0. 


eo v ŸE 


Le théorème des résidus montre donc que : 
lim R (Log r)? + (Log r + R , 
0 ———— — —; ——— = 
R — œ € Are 
2 ri Z Rés (f, zx) 


la sommation concernant tous les pôles z; du demi-plan 
supérieur. En fait, il n‘y en a qu'un seul : z = ;. On montre 


ue (2) 2 _—. 
que, pour une fraction le résidu en un pôle simple zx 


B (2) 
A (zx) 


B (a) Cela donneici: 


vaut exactement 


(Log is — 7? 
TR. 8i 


La suite de la décomposition de l'intégrale est : 


Rés (£,i) — 


: l fx 2 (Log r)? 
lim f de | EST ri 
ce 0 n (2) 1 +r2 dr 
R— 
_.f® Logr of dr 
ri | Er LS ls Tr 
ee 78 
97 nn à 
Les résultats classiques : 
fo SL fo dr T 
sdr=0 t = > 
Jo 1 + 5 Jo 1+7r2 2 
permettent alors d'écrire le résultat : 
Fæo (Log x)? Tè 
SR Or un 
Ja Tr TT 
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À En haut, figure 46 : 
décomposition de 

la courbe d'intégration 
en le segment [— PR, + R] 
et le demi-cercle. 
Ci-dessus, figure 47 : 
voir développement de 
cette application de 

la théorie des résidus 
dans le texte. 
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» Figure 48 : 
points réguliers 
et points singuliers. 


Prolongement analytique 

L'idée simple du prolongement par continuité pour les 
fonctions réelles de variable réelle, que l'on peut illustrer 
par l'exemple de l'application définie sur R — {0}, 


f:x+H exp (5) pour laquelle on peut définir une 


fonction continue sur R, égale à f sur R — {0}, soit: 


gi srrer (-5) six 0 
> 


: : FT : 
puisque lim exp al = 0 se transcrit pour les fonc- 
x—0 X° 


tions de variable complexe par une notion plus forte : 
celle du prolongement analytique. Partant d'un ouvert 
Q « C et d'une fonction f : Q — C, holomorphe dans Q, 
on cherche à construire un ouvert Q’ = Q, une fonction 
g:Q/ = C holomorphe dans Q’ telle que f (z) = g (2) 
sizeQ. 

En notant R le rayon de convergence (non nul et fini) 
de la série entière égale à / dans Q, le problème du prolon- 
gement se pose sur la frontière du disque de convergence, 
c'est-à-dire pour des points 6€ C tels que lt = R. 
Le point t est alors point régulier si le prolongement est 
possible dans un voisinage de t; sinon, c'est un point 
singulier. Par exemple, grâce aux résultats obtenus sur les 


séries on sait que é — + 1 est un point singulier pour 

Le) 

D 2, que t= + 1 et t——1 sont points singuliers 
co D, 2n 

our z2#, que t — + 1 est point singulier pour » —. 

pour © q p gulier pour » + 


La caractérisation de ces points peut se faire au moyen du 
théorème suivant : soit { un point du disque de conver- 
gence — de rayon R, centré à l'origine — de 7, tel que 
[t, — R. Soit Ra le rayon de convergence de la série 
œ 


> Cn (a) (z—a)* qui représente f au voisinage de 
a=r.t(où0 <r<1). 
Alors : t est régulier Ra > R— {al 

test singulier Ra — R—|a| (fig. 48). 


Il est possible d'affirmer l'existence d'au moins un point 
singulier sur le cercle de convergence d'une fonction 
cel 


analytique. En particulier, si D représente f dans Q 
et si les coefficients c, sont tous réels positifs, le point 
t— R est un point singulier. 


Développements eulériens — La fonction E 


On appelle fonction méromorphe sur un ouvert Q 
du plan complexe une fonction holomorphe sur un 
ouvert Q’ obtenu en privant Q de points isolés qui soient 
des pôles de cette fonction. Ceci revient à dire que, 
au voisinage de chaque point de Q, une fonction méro- 
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morphe est un quotient de deux fonctions holomorphes. 
On doit à Cauchy une méthode pour exprimer une fonc- 
tion méromorphe dans € sous forme de série convergente, 
en dehors des pôles; il s’agit en fait de généraliser la 
décomposition des fractions rationnelles en « éléments 
simples ». Cette méthode permet d'exprimer une fonc- 
tion impaire, en tout point autre qu'un pôle, par une 
double sommation dès lors que le module de la valeur de 
cette fonction sur des cercles de rayons croissant 
indéfiniment, sans passer par un des pôles, est uniformé- 
ment borné, soit : |f (rnefe)| < K pour tout n et tout p. 
En désignant par ar les pôles def,ona: 


_* | FC 
f (20) — rs: ( r 2 ne Rés — ax | | 


L'application de cette méthode permet d'obtenir le 
développement eulérien de cotg z : 


cot 5: L2z É 1 
hat z2— nèr? 
n= 1 
puis celui de sin z: 
æ 2 
: Z 
sinz=z. Il Er) 
nèT 
n=i 


D'une façon générale, le théorème de factorisation 
de Weierstrass permet d'exprimer une fonction entière 
sous forme de produit infini à partir de la connaissance des 
points où elle s'annule. 


a 
1 
Ne 
Si 2 PATES < ©, alors, en posant 
z 1 /z\? 
Py (2) = (2) ES (Z 
Zn P \Zn 
eo z 
le produit infini IT (1 — =) + ePrG) converge uniformé- 
1 n 


ment sur tout compact et représente une fonction entière 
dont les zéros sont les points zx. 

C'est comme limite d'un produit infini que la célèbre 
fonction gamma, bien connue des statisticiens, des phy- 
siciens, etc., a été l'objet des premiers travaux (Euler, 
Gauss, Weierstrass). 

On pose d'abord : 

n! 
EX 0) = —————— ————NnN 
EN Gr2.-GTrn 
Puis l’on définit : 
T(x+1)=IL(x) = lim I (xn) 


n + © 


Si l'on définit la constante d'Euler C par: 
C— lim (1 FPT L— Log n). 
n> 2 n 
on peut alors montrer que : 


TG T =.  : Éd il [(r +5 e-ÿl 


et cette fonction est alors définie pour tout x, réel, positif 
strictement. 

ILest alors possible de prolonger sa définition sur tout le 
plan complexe privé de l'origine : 


re = 2 Il [U +5) ri] 


1 
et la fonction z+-+ l' (z) obtenue est analytique, sauf aux 
points : z—=—1,—72,.,—n,.…, qui sont des pôles 
simples. On peut remarquer qu'elle ne s'annule jamais 


puisque ne possède pas de pôle. 


1 
T (2) 
Un calcul simple montre que : 

1 1 so z? 

— = = —Z 1—— u 
TO Tea ï ji] mraez 
ce qui, grâce au développement eulérien de sin z, donne 


« Géométrie de Riemann : 
la somme des angles 

d'un triangle n'est pas égale 
à deux droits. 


sin 7z 
que l’on obtient en notant que : I (1 — z) = —2zT (— 2) 
[cette relation est obtenue à partir de la plus générale : 
xT' (x) = T' (x + 1) que l'on retrouvera plus loin]. 


la formule des compléments : L' (z) : F (1 —z) = 


On en déduit que : T 6) = V7. 


ILest ainsi possible de construire des valeurs successives 
de cette fonction. C'est à Legendre (1752-1833) que 
l'on doit la présentation de T' (z) sous la forme d'une 

se LU PE à 
intégrale définie. Posant : E (z, n) — : ( à] *t2-1 dt, 


il en déduit : 


L 
E@m= | (1 — ur + uë-1. nidu = 
n? ; 


V 


1 
. (1 — u)tuz-1 du, 


n\n? 1 | 
zG+1).G+n) 2z IT (Zn) en inté- 


grant par parties. Ceci lui permet de redéfinir la fonction 
T (z) lorsque Re (z) > 0 par: 


puis:E (z,n) = 


p co 


T (2) = » et.tiz1dt 


et d'obtenir ainsi sur le demi-plan ouvert où Re (z) > 0 
une fonction holomorphe. 

Une simple intégration par parties permet alors de 
retrouver la relation : L (z+ 1) = zT (z). 

L'étude de l'équation fonctionnelle L (z + 1) = zT° (z) 
a amené à redéfinir la fonction gamma comme étant la 
solution du système : 


| o (x+1) = xp (x) 
p(1)=1 
soit, en posant g (x) = Log ® (x) : 
[ g (x+1)—g (x) = Log (x) 
Ug(t)=0 

Il existe une et une seule fonction convexe g vérifiant 
ces deux dernières relations. 

La relation fonctionnelle L' (x + 1) = xT (x) admet 
évidemment comme conséquence que l'(n+1)=n1! 
pour tout entier n positif. Ceci justifie l'appellation parfois 
donnée de fonction « interpolant les factorielles »; en 
outre, on retrouve que 0! — 1. Elle permet aussi d'établir 
la célèbre formule de Stirling : 


ni=Y2rn.nm.e-n (1+ e (n)) avec lim € (n) = 0, 
n—+ © 


cas particulier de : L'(x) = V27x:x7-1.e-x (1+e (x)). 
La fonction bêta peut être considérée comme une géné- 
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ralisation de la fonction gamma. Pour deux nombres 
complexes x et y de parties réelles positives, on pose : 


B (x y) = 
et l’on montre que B (x, y) = B (y, x). 
Un calcul simple donne : 


1 
EE 1 — 992 


T(d:Tr (y) 

VX) 

Cette fonction vérifie les équations fonctionnelles 
suivantes : 
B(xXy)=B(x+1y)+B(xy+1)= 


B (x y) = 


ATX "7 ee F 
BU 1,y) = 7 B (x y + 1) 
! ; Xy 
Bx+1,y+1) = 08 (x 
REP PERE berge PU 
et permet entre autres, grâce à la formule : 
B (x x) = 23. B (x :) 


de retrouver la formule de « duplication » : 


2 


Très fréquemment utilisées, ces fonctions ont un impact 
particulier en probabilités. 


2 T(2x)=2%.T GT (x+ 3). 


Représentation conforme 


C'est au mathématicien allemand Riemann (1826- 
1866) que l'on doit la notion de courbe analytique 
complexe, ou encore surface de Riemann, qui a conduit au 
développement actuel de la géométrie algébrique. Repre- 
nant les travaux de Gauss sur les bijections différentiables 
qui conservent les angles, il leur donna une nouvelle 
impulsion en leur appliquant les résultats alors connus 
de la théorie des fonctions de variable complexe. 

En effet, la notion d'holomorphie recouvre la notion 
géométrique de similitude : en rapportant l'espace vecto- 
riel réel C (de dimension 2) à sa base usuelle {1,/}, une 
similitude directe de centre O,z += u : z où u est un nom- 
bre complexe non nul, u = a + ib, est linéaire et admet 
relativement à cette base la matrice : 


( | 
b à 
Si maintenant on pose u = f” (zo), où f est une fonc- 


tion holomorphe en zo:f— P +0, les conditions de 
Cauchy-Riemann : 


ëP _ 6Q 
ox oy 


P__ co 
y  ©x 


et 


| 
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À À gauche, figure 49 : 
conservation des angles. 
A droite, figure 50 : 

les deux projections 
stéréographiques. 


Le mathématicien 
allemand 

Bernhard Riemann 
(1826-1866) : 

il développa l'idée 
d'une géométrie fondée 
sur l'hypothèse 

suivant laquelle par un point 
on ne peut mener 
aucune parallèle 

à une droite. 


: la Découverte, Paris 


montrent bien que la matrice jacobienne de f, soit : 
êP 60 
ox 0x 
&P 
y 


__ |, est une matrice de similitude. 
ê 
92 

Par conséquent, si l'on définit une transformation 
conforme comme une application d'un domaine D & R? 
dans R? différentiable, telle que l'application linéaire 
dérivée conserve les angles orientés, alors toute fonc- 
tion £, holomorphe en un point zo (resp. sur un domaine D), 
définit une transformation conforme en zo (resp. sur D) 
dès lors que f” (20) £ O (resp. f’ (2) O pour tout 
zeD). 

As notion d'application conforme introduite par la 
conservation des angles pour l'application dérivée peut 
s'expliquer comme suit (fg. 49). 

L'angle de deux courbes est défini comme l'angle de 
leurs tangentes; alors une transformation f est conforme 
si l'angle des courbes C et C’ en zo peut être « transporté » 
sur l'angle des courbes images f o Cet f © C’ au point zZo. 

Lorsque la fonction f est injective et holomorphe, on 
montre qu'elle définit un homéomorphisme de l'ouvert 
(supposé de plus connexe) D — où elle admet ces deux 
propriétés — sur l'ensemble f (D), qui est aussi un ouvert; 
de plus, l'application réciproque f-1 est holomorphe dans 
f (D). On dit, dans ce cas, que les domaines D et f (D) 
sont conformément équivalents, ou isomorphes. Très 
exactement, on dit qu'un homéomorphisme d'un ouvert D 
sur un ouvert D’ défini par une fonction holomorphe est 
un isomorphisme de D sur D’ lorsque l'application réci- 
proque est aussi holomorphe (il s’agit, bien entendu, de 
prendre en considération non seulement les propriétés 
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‘pôle nord” 
N 


topologiques, mais aussi celles induites par l'analyse 
complexe). 

Le problème fondamental de la représentation conforme 
est en quelque sorte la réciproque : deux ouverts D et D’ 
du plan complexe, donnés, sont-ils isomorphes ? 

Ses ramifications sont très vastes, et l'on peut citer en 
particulier la résolution de problèmes aux limites (pro- 
blème de Dirichlet) relatifs à des potentiels (newtoniens 
par exemple). 

Le problème n'est pas simple, car tout homéomorphisme 
de D sur D’ n'est pas forcément un isomorphisme. Par 
exemple, le plan complexe € et le disque ouvert 


D = {ze C tels que |z| < 1} 


sont homéomorphes mais pas isomorphes (car un 
isomorphisme de € sur D serait holomorphe et borné, 
donc constant, et par suite non injectif). 

On montre d’abord que, si f est un isomorphisme de 
D sur D’ et © un isomorphisme de D sur D (ou auto- 
morphisme de D), alors f + ® est encore un isomorphisme 
de D sur D’. Toutes les représentations conformes de 
D sur D’ peuvent donc être obtenues à partir de l'une 
d'entre elles par composition avec un élément quelconque 
du groupe des automorphismes de D. La détermination 
de ce groupe peut donc être très utile. Ainsi, il est facile 
de voir que l’ensemble des automorphismes de C est 
formé des transformations z+> az — b où a est non nul; 
on peut aussi montrer que les automorphismes du disque 
unité ouvert D sont les transformations homographiques : 


zH ei8 =) oùB8eRetze D sont arbitraires. 
1 +202 

Enfin le théorème fondamental (énoncé par Rie- 
mann) de la représentation conforme — tout ouvert 
V « C est isomorphe au disque ouvert unité D s'il est 
distinct de C et simplement connexe — permet de répon- 
dre au problème posé. Toutefois, il est à noter que la déter- 
mination approchée de la fonction holomorphe qui définit 
l'isomorphisme de V sur D est en général très difficile 
et relève du calcul numérique. 

On peut dire que la représentation conforme est à la 
fois, parmi les problèmes relatifs aux fonctions de variable 
complexe, le plus ancien et l’un des plus pratiqués couram- 
ment. En effet, la projection stéréographique est une 
invention grecque et est l’un des outils privilégiés de la 
cartographie. Il s’agit (fig. 50) de l'application qui, à tout 
point M (x1, x2, x3) de la sphère unité de R3 tel que x3 £ 1, 


X1 X2 
| du plan x3 = 0; ce 


1— x3 1 —Xx3 


associe le point M” ( 


point M’ n'est autre que l'intersection de la droite joignant 
le « pôle nord » de la sphère au point M avec le plan x3 = 0. 
Si l'on identifie ce plan au plan complexe, on a l'applica- 
tion : 


X2 


+ i 
1—Xx3 


1: (x, x2,X3) 


mes, 
1 — Xx3 
qui est une représentation conforme de la sphère privée 
du pôle x3 — 1 sur le plan complexe. 

On pourrait aussi bien définir la projection stéréogra- 
phique relative au « pôle sud » x3 = — 1, qui, composée 
avec la symétrie par rapport à l'axe x1, donne la représen- 
tation conforme : 
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at pe ND 
1+x3 1 — X3 
de la sphère privée du pôle x3 = — 1 sur le plan C. 


On peut encore donner quelques exemples de repré- 
sentations conformes. La fonction z + log zest, on l'a vu, 
une représentation conforme du plan privé du demi-axe 
réel négatif sur la bande B_- — {z€ C tels que |1m z| < 7}. 
C'est donc une représentation conforme (fig. 51) du 
« secteur » S = {ze C tels que 81 < Arg z < 62} sur la 
bande Be, 62 — {ze C tels que 81 < Im z < Go}. 

On peut donc considérer la transformation conforme 
réciproque réalisée par la fonction : z++ e* dont la res- 
triction à la bande : Bo = {z € C tels que 0 < Imz< 27, 
est injective, et qui envoie cette bande sur le plan privé 
(on dit aussi fendu le long) du demi-axe réel positif. Sur 
la figure 52, on a représenté la transformation sur les 
segments des droites x — k, inclus dans la bande et sur les 
droites y = k’ de la même bande, et dont les images res- 
pectives sont des cercles centrés à l'origine, privés de 
leur seul point réel positif d'une part et des demi-droites 
partant de l'origine. 

De là, on peut par exemple étudier la transformation 
associée à z- ef. Puis, en composant avec celle définie 
par:t “2 (e + °). on obtient la représentation conforme 
associée à : z+> cos z sur l'ensemble ouvert D = {2€ C 
tels que O0 < Re z < + et Imz> 0}. En particulier, on 
peut voir que le segment de la droite y = k inclus dans D 
est transformé en une ellipse dont les foyers sont les 
points réels + 1 et — 1 et que la demi-droite x — k° 
incluse dans D est transformée en une hyperbole homo- 
focale (fig. 53). 


o2 : (X1, X2, X3) > 
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<« Figure 51 : 
représentation conforme 
du secteur S 

sur la bande B6,, 6: 

par la fonction 
logarithme complexe. 


« Figure 53 : 
représentation conforme 
par la fonction cosinus. 
Les segments y = Cte de D 
deviennent des ellipses, 

et les demi-droites 

x = Cte de D 

des hyperboles 
homofocales. 


<« Figure 52 : 
représentation conforme 
de la bande Bo sur € 

privé de R+, par 

la fonction exponentielle ; 
transformation des droites 
x = Cteety = Cte. 


» Figure 54; 
série de Fourier 
de la fonction 2 r-périodique 
égale à x sur 
1] 2r:y=7r—2 
sin x sin 2x _ 
1 2 
sin 3 x 
Tu … 


Figure 55; 

série de Fourier 

de la fonction 2 r-périodique 
égale à x sur [0, 7] 
età— x sur[— 7, 0]: 


y = Ée (cos X°+ 
cos3x  cos5x à ) 

32 52 
Figure 56; 


série de Fourier 
de la fonction 2 r-périodique 
égale à x sur ]— 7, + rl: 
sinx sin2x 
he ne SRE sui 
sin 3 x 
3.) 


Figure 57; 
série de Fourier 
de la fonction 2r-périodique 


T T 
égale à x sur | Le + z| 


cs En 
etär—xsur |5-; |: 
in 3 x 
VS sinx— + 
sin 5 x 
52 7 1 ” 
Figure 58; 


série de Fourier 
de la fonction 2 r-périodique 
égale à x2 sur [— 7, + rl: 


r2 cos x 
Sr dote 1 
cos2x  cos3x 
- 25 32 mm” | | 
Figure 59; 


série de Fourier 

de la fonction 2 r-périodique 
égale à cos x sur 10, 7[ et à 
sin x sur ]— 7, 0[ : 


= 
YT >} 1:3 
4sin4x Dex. ) 
3.5 5.7 ° 


Richard Colin 


Analyse harmonique 


Par les liens très étroits que l'on peut tracer entre l'ana- 
lyse harmonique et la théorie de l'intégration, par ses 
applications en physique et par la contribution apportée au 
concept moderne de fonction, on peut dire que cette 
branche des mathématiques est la pierre de touche de 
l'analyse mathématique. C'est en étudiant l'équation des 

Haine ©?y > y I RAate ; 
cordes vibrantes + — a a que e mathématicien suisse 
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Daniel Bernoulli (1700-1782) introduisit une fonction 
(solution de cette équation) sous forme d'une série 
trigonométrique : 


a0 


FO = 


Cr: MT _. . M 
> (an cos x + bn sin x 
n=1l / / 


L'analogie acoustique a conduit à donner l'appellation 
« harmonique » aux termes de cette série autres que le 
« niveau fondamental » obtenu pour n = 1. 

Le développement en série trigonométrique, 


> (an cos nx + bn sin nx) où > On COS (NX + On), 
nn, 0 m0 


ou encore 1 cn et, des fonctions périodiques allait 
hez 

alors permettre de considérer les fonctions indépendam- 
ment des propriétés de continuité, de dérivabilité, etc. 
C'est ainsi que J. Fourier essaya de représenter des 
fonctions discontinues comme somme de séries trigono- 
métriques (fig. 54, 55, 56, 57, 58, 59) ; le même problème 
que celui posé par la série de Taylor, c'est-à-dire la conver- 
gence de la série de Fourier d'une fonction vers cette 
fonction, ouvrait alors tous les développements de l'ana- 
lyse harmonique et de la théorie spectrale. 


Séries trigonométriques 
Soit / une fonction de variable réelle, 2 r-périodique 
(cette valeur n'étant évidemment pas restrictive pour ce qui 
suit), que l’on suppose intégrable. On appelle coefficients 
: 1 fer 
de Fourier de fles nombres cn (f) = es f(x) etrz dx 
Jo 
(si la fonction était de période T, on poserait 
SEeS 27, 
LE — — int 
Cn (f =) f(x) 87% dx) 
définis pour tout n € Z, et on dira que la série 


> Cn (f) ent 

nez 
est la série de Fourier de f. Le problème étant de savoir 
dans quel cas cette série est convergente de somme f 
(ponctuellement ou uniformément selon les cas), on est 
amené à étudier l'influence des propriétés éventuelles de f 
(continuité, différentiabilité, etc.) sur la convergence de la 
série et à introduire un nouveau type de convergence par 
les moyennes arithmétiques des sommes de Fourier que 
l'on appelle les sommes de Féjer : 


ox (x) = SN SEM + e + Êx ns EN 
+N 
5 jen 
— 2!) © (F) eirt 
r. N) k 


où l'on pose Sx (7, x) = 3 


k= -n 


cx (f) efkz (somme de 


Fourier). 


Les hypothèses fortes que l'on peut (dans certains cas) 
faire pour la fonction f donnent les résultats suivants : 
— si la fonction f est deux fois continüment déri- 
vable, alors la série de Fourier de f converge absolument 
et uniformément vers f; 
— si la fonction f est différentiable, sa série de 
Fourier converge uniformément vers f; 
— si la série de Fourier de f est normalement 


convergente (c'est-à-dire si > |Cn (f)| converge), f est 
nez 
somme de sa série de Fourier. 

En affaiblissant les hypothèses, on obtient alors que, 
si f est une fonction continue, les sommes de Fourier 
Sn (f, x) ne convergent vers f (x) que presque partout 
(c'est-à-dire à l'exception de points formant un ensemble 
dont la mesure est nulle): par contre, les sommes de 
Féjer ox (f, x) convergent uniformément vers f (x). Il 
existe des fonctions continues qui ne sont pas égales à la 
somme de leur série de Fourier, comme l'a montré Féjer 

Le] 
avec la fonction f (t) = Lei. Fxx (#) où, pour 
k=1 


tout k, Nx est un entier vérifiant lim Nx= +00 (suite 
k— 
d'entiers croissant indéfiniment) et où Fx; est le « poly- 
Nx . 
£ sinnt 


nôme trigonométrique » Fxx (£) = » ; pour cette 


n=l 


2 
1 
fonction f on a cn(f)= > ge Cn-2xx (Fx), et la 
k=1 


série de Fourier ainsi définie diverge au point O. 

Les fonctions de carré intégrable (voir le paragraphe 
Intégration) possèdent une propriété de convergence pour 
leur série de Fourier, mais relative à la structure hilber- 
tienne de l’espace L?, c'est-à-dire que, si f est une fonc- 
tion 2 r-périodique, fe L2[0,27],ona: 

+N 
s Par fs 
lim [| |F (x) — p1 Cn (f) eirr|? dx] = 0 
N = 0 LN 

Pour les fonctions de cette classe, on possède encore 

les remarquables formules de Parseval : 


1 f2z 

sal. f (6) g () = 2 0 (f) c-n (9) 
7 2 dt = 

rs AC) dt Z le» (1e 


vérifiées pour tout fe L? [0, 2 7] et tout gelL?[0,27]. 


La transformation de Fourier 


Le développement d'une fonction en série de Fourier 
fait apparaître une correspondance qui, à une fonction f, 
2 r-périodique et intégrable, associe une fonction Cx (f) 
définie pour n € Z. On va généraliser cette transformation, 
associant à toute fonction f intégrable son image (ou 
transformée) de Fourier F définie par : 


Le 


F (t) = e?ritz f (x) dx; 


on note souvent F = #7. Ceci permet d'obtenir un outil 
d'analyse applicable à des fonctions pour lesquelles les 
méthodes des séries de Fourier sont inadaptées (éléments 
de l’espace L! [0, 2 7] par exemple). Il faut noter que le 
coefficient — 2 x est placé dans cette définition, bien que 
son usage ne soit pas totalement généralisé; son plus 
grand intérêt réside dans la simplicité de la propriété de 
« réciprocité » qu'on expose plus avant. 

Si f est une fonction intégrable, sa transformée de 
Fourier est continue, bornée et tend vers zéro à l'infini : 

lim F(t) = 0. Cette « régularité » est d'autant plus 
11 + co 
accentuée que la fonction f est elle-même régulière; 
ainsi, lorsque f est p fois continüment dérivable, on a 
Ff@) = (2 rit)PFF et, de plus 


1 f + oo 

= — f@) (x)| dx, 

EP | LT FE QI 

ce qui montre qu'alors Ff— F tend vers zéro à l'infini 

de façon encore plus marquée. . 
Réciproquement, si x?f (x) est intégrable, alors $f est 

p fois continâment dérivable, et l'on a: 


(FAO (6) = FI(—27ix)r f (9)]. 


Enfin, une étude plus précise montre que la transformée 
de Fourier d'une fonction se « disperse » d'autant plus 
que la fonction est « tassée » (en ce qui concerne leurs 
valeurs). 

On introduit, parallèlement, la transformation de Fou- 
rier conjuguée, %, souvent appelée réciproque, définie 
pour toute fonction intégrable par 


[IF (| < 


Fr = [7 errizf (x) dx. 


On peut alors dégager l'aspect essentiel de la transfor- 
mation de Fourier ; en effet, si une fonction f est intégrable 
et si sa transformée F7 l'est aussi, on peut écrire que 


f= F (Ff). En d'autres termes, la transformation de 
Fourier — pour cette catégorie de fonctions — caractérise 


une fonction à partir de sa transformée, et vice versa : 


Palais de la Découverte, Paris 


c'est la propriété de réciprocité. Dans le cas des distribu- 
tions (voir Analyse fonctionnelle), on parlera pour ces 


transformations & et & d'isomorphismes continus de 
l'espace des distributions tempérées. 

La propriété fondamentale de la transformation de 
Fourier est liée à la notion de produit de convolution. 
On peut considérer les coefficients de la série de Fourier 
d'une fonction comme une transformée de Fourier définie 


sur Z en posant F(& = cz (f); or la première formule 
de Parseval peut s'écrire : 


co (fg) = D cn (f) c-n (g) et Cm (fg) = co (fge'"?) 


nez 


implique Cm (fg) = > Cn (f) Cm-n (g), ce que nous 

CRE Pas FE UN A 

écrirons donc fg (m) = Dr (n) g (m—n). D'autre part, 
nez 

cette même formule de Parseval peut s'écrire : 


r2T 

Zen (9 on (g) ent = D [UT 09 9 (— 2) dx 

neZ Fr 

On voit donc apparaître une loi de composition entre 
fonctions définies sur un ensemble discret dans le premier 
cas, sur un ensemble continu dans le second; on abordera 
seulement ce dernier cas. Soit f et g deux fonctions inté- 
grables sur R, on appelle produit de convolution de à 
et g la fonction f x g définie par: 


fxg (= |" F0 g (E— x dx 
J -o 
et l'on montre qu'elle est intégrable. Dans ces conditions, 
on peut énoncer que % (fxg) = (Ff) (Fg) et 
F (fg) = (FF) x (Fg). La première de ces formules 
n'est autre que la formule générale de celle trouvée plus 
haut pour les coefficients de la série de Fourier, soit 


Le 0 lei 

fg (m) = > f(n)g (m—n). Cette propriété trouve 
nez 

des applications très nombreuses tant dans la résolution 

des équations aux dérivées partielles qu'en calcul des 

probabilités. 

La transformation de Fourier trouve une cohérence parti- 
culièrement nette avec la théorie de l'intégration et le 
problème de la mesure de Haar dans le cadre des groupes 
abéliens localement compacts (par exemple R ou R?, 


— ; 
ou encore le tore | — CES dd encore Z) ; son extension 
aux fonctions généralisées ou distributions permet de 
précieuses utilisations en physique. 
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<« Le mathématicien 
français Joseph Fourier 
(1768-1830); 

ses travaux conduisirent 
à l'une des grandes 
études mathématiques 
du XIXe siècle : celle des 
séries dites de Fourier. 


Giraudon 


À Portrait 

du mathématicien 

et physicien francais 
Pierre Simon de Laplace 
(1749-1827). 


La transformation de Laplace 

La transformation de Fourier peut être étendue aux 
fonctions de plusieurs variables et donne les mêmes résul- 
tats principaux. Elle peut être encore étendue au plan 
complexe, mais en ne considérant cette fois que des fonc- 
tions d'une variable réelle, nulles en dehors de l'ensemble 
[0, + of. En raison de cette restriction, on a recours à la 
fonction dite d'Heaviside, notée Y, telle que Y (t) — 0 
sit < 0,etY (t) = 1 sit > 0. Si f est donc une fonction 
nulle hors de [0, + o[ — si ce n’est pas le cas, on consi- 
dère alors Y (t) f (t) — on appelle transformée de Laplace 
de f la fonction de la variable complexe z définie par : 


CF (z) = 1 f (#) ef dt. Ainsi, la fonction d'Heavi- 
side Ÿ a pour transformée 1, ce que l'on note CY(é) au 


É 1 2 sn 2 = 
lieu de tn £Y ; de même, on voit aisément que e-42[ à 


si S () =1 pour t— a > 0 et 5 (t) = O sinon. Un 
calcul simple montre que, si z — x + jy en fixant x, 


Cf (2) = F [f (0 er] 5) 


Le domaine de définition de £f est déterminé par le 


be 
fait que, si 1 f (t) eo dt converge absolument, alors 


+00 
f f (t) e"tz dt converge absolument et uniformément 
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dans le demi-plan fermé Re (z) > Re (zo) et dans l'angle 


|Arg (2— z0)| < 8 pour 8e [o. | si | (t) e to at 


converge simplement. On définit alors l'abscisse de conver- 
gence absolue comme l'élément unique «€ R tel que : 


° + oo 
Re()>a— | |f(#).e-t4 at < +00 
0 


et Re (z)j< a = 1 If (t) e-t2] dt = + oo 


et l'abscisse de convergence comme l'élément unique 
8 ER tel que: 


°+ 
Re (2)> 8 = | dr" (t) etz dt converge 
“0 


CE 
et Re(2<8= | (1) et: dt diverge: 
0 


il est clair que & < «. Par exemple, l'abscisse de conver- 
gence absolue de Ÿ (t) est « — O. 

On montre aussi que la transformée de Laplace est 
holomorphe dans le demi-plan de convergence, 


Re (2) > B; 


dans ce demi-plan, si F (z) Cf (t),on a F@) (Z)C(—#)Ff (t) 
pour tout k. 

Enfin, comme pour la transformation de Fourier, on a la 
propriété fondamentale : 


£ (fx g) = (Lf) - (Lo). 

C'est cette propriété qui donne lieu au plus important 
développement de la transformation de Laplace, le ca/cul 
symbolique, destiné à résoudre, après lecture des tables 
de transformées, les équations de convolution de la 


forme f x g — h où g est inconnue (par transformation 
de Laplace, ces équations s'écrivent £f. £g = Ch, soit 


CA D ‘ 
encore £g = 2 Ainsi, pour déterminer f telle que 


st 
| F (x) ex) dx = t, on pose l'équation sous la forme : 
v0 


Y (x) e#7 x f (x) = tY (#); en prenant les transformées 


1 1 k 
F F = — ñ Ç Æ ss, ad 
I 4 2 soit Lf = 2! 


de Laplace, on obtient = 
par conséquent, la transformation de Laplace étant injec- 
tive,onaf (x) = Y (x) (1 — kx). 

Ce calcul symbolique est d'un usage très courant (par- 
ticulièrement dans les problèmes d'automatique, où les 
problèmes sont résolus à l'aide d'une transformation 
opérant sur une variable discrète, la transformation en z 
qui a de multiples applications, économiques par exemple, 
dès que l'on aborde des modèles dits « avec retard »), 
en raison de sa simplicité (on se borne en général à lire 
des tables) et du formalisme très simple qui en est la 
base et qui trouve une très belle application dans le 
cas des mesures et des distributions. 
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ANALYSE FONCTIONNELLE 


Espaces fonctionnels 


La notion de « fonction » est fondamentale en mathé- 
matiques. Ainsi qu'on l'a vu dans le chapitre Langage 
ensembliste une fonction (ou plus généralement une 
application) est définie comme un procédé « qui met en 
correspondance » un ensemble E et un ensemble F. Ce 
procédé associe à tout élément x de E un é/ément unique 
y de F dont la dépendance à l'égard de x est symbolisée 
par l'écriture y = f (x). La lettre f représente le procédé 
en question. L'on parlera donc de la fonction f:E —F. 

Il s’agit donc d’une notion suffisamment générale pour 
être utilisée selon des points de vue très divers. Les algé- 
bristes s'intéressent plutôt aux propriétés globales des 
fonctions : ils les définissent et les étudient dans la mesure 
où celles-ci « transportent » une structure algébrique d'un 
ensemble vers un autre (homomorphismes, isomorphis- 
mes, etc.). Par contre les analystes s'intéressent plus volon- 
tiers aux propriétés locales. Ainsi étudient-ils les points 
de singularité des fonctions, c'est-à-dire les points de 
l'ensemble de départ où « il se passe quelque chose » 
(discontinuités, comportement asymptotique, etc.). Mais 
algébristes et analystes s'accordent sur un point : une 
fois qu'ils ont jeté leur dévolu sur une fonction f, ils ne 
sont guère enclins à élargir leur champ d'étude en consi- 
dérant d’autres fonctions qui, au regard de certains cri- 
tères, « ressemblent » à 7. 

A l'inverse le point de vue de l'analyse fonctionnelle 
consiste à remarquer que l'écriture f (x) présente une 
symétrie entre « f» et « x ». Dès lors il est tentant de consi- 
dérer également « f » comme variable. 

L'analyse fonctionnelle est donc l'étude des ensembles 
de fonctions (ou espaces fonctionnels) et des structures 
algébriques et surtout topologiques dont on peut les 
munir. Nous verrons d'abord comment un espace fonc- 
tionnel est, le plus souvent, un espace vectoriel topolo- 
gique (en abrégé e. v.t.). Procédant du général vers le parti- 
culier, nous verrons apparaître ensuite : les espaces loca- 
lement convexes, les espaces de Banach, les espaces de 
Banach réflexifs, les espaces de Hilbert, enfin les espaces 
de dimension finie, c'est-à-dire R7. Ainsi donc, l'analyse 
fonctionnelle développe des concepts permettant de 
rassembler dans un même formalisme la topologie, l'ana- 
lyse, d'une part, et la géométrie et l'algèbre, d'autre part. 
À cet égard, l'analyse fonctionnelle est d'un intérêt théo- 
rique tout à fait évident. Mais elle répond aussi aux besoins 
de l'analyse numérique : une équation aux dérivées par- 
tielles, par exemple, est une équation dans laquelle 
l « inconnue » est une fonction (d'une ou de plusieurs 
variables), et non plus un nombre où un vecteur comme 
dans les équations algébriques; il importe donc de déter- 
miner a priori l'espace fonctionnel auquel appartien- 
dront la ou les solutions de l'équation. D'autre part, la 
résolution pratique des problèmes d'analyse numérique 
nécessite la mise en œuvre de procédés d'approximation : 
«approcher » une fonction suppose que l'on soit en mesure 
de définir l'idée de « proximité » — c'est-à-dire la notion 
de voisinage — dans un espace fonctionnel. C'est dire 
l'intérêt qu'il peut y avoir à étudier les espaces fonctionnels 
d'un point de vue topologique. 

Soit donc E et F deux ensembles; nous noterons FE 
l'ensemble de toutes les applications de E dans F. Cet 
ensemble est particulièrement vaste et, suivant la nature 
du problème à résoudre, nous nous restreindrons à tel 
ou tel sous-ensemble de FE: il convient d'ores et déjà de 
faire la remarque suivante : si l'ensemble d'arrivée F 
est muni d'une certaine structure (algébrique ou topo- 
logique), il est souvent possible de munir FE d'une struc- 
ture analogue. L'ensemble de départ E joue un rôle 
secondaire dans la définition de structures sur l'ensem- 
ble FE : ainsi, si F est un espace vectoriel (sur R), FE est 
aussi un espace vectoriel pour les deux opérations : 


(f+g)(x)=f(xH +g(x) VxeE 
nf (x) = À #7 (X) VxeE,VreR 


Supposons maintenant que F est un espace métrique; 
il semble légitime d'espérer que FE puisse être lui aussi 
un espace métrique. Cela n'est pas le cas, car il n'est pas 
possible de munir FE d'une distance. Cependant, en 
se restreignant au sous-ensemble (FE); des applications 
bornées, on peut obtenir ce résultat : soit en effet d 


la distance définie sur F, et f et g deux fonctions bornées 
deFE; il est aisé de démontrer que la quantité 


à (f, g) = sup d (f (x), g (x)) 


XEeE 


est définie et qu'elle permet de définir une distance sur 
(FE). 

Il est facile de déduire de ces deux résultats que, lors- 
que F est un espace vectoriel normé (voir 7opologie), 
alors l'ensemble (FE), est aussi un espace vectoriel 
normé en posant : 


I£IIl = sup ||f C9] 


Les espaces métriques complets sont très appréciés en 
analyse fonctionnelle : rappelons que, dans de tels espaces, 
on est assuré de la convergence d'une suite, même si on 
est dans l'impossibilité d'en déterminer la limite, pourvu 
qu'il s'agisse d'une suite de Cauchy. Des résultats impor- 
tants d'analyse sont établis dans le cadre des espaces 
complets. Il est donc intéressant de savoir dans quelle 
mesure un espace fonctionnel peut être un espace 
complet. 

On démontre le résultat suivant : si F est un espace 
métrique complet, l'espace métrique (FE)» est aussi 
complet. 

Exemple considérons l'ensemble des fonctions 
continues de [a, b] & R — R. Il s'agit de fonctions 
bornées (l'intervalle [a, b] étant compact, les fonctions 
continues y sont bornées). Nous avons donc affaire à une 
espace normé, complet, c'est-à-dire à un espace de 
Banach. 


Convergence simple 
et uniforme d'une suite de fonctions 


Nous allons définir deux types de convergence de 
fonctions : la convergence simple et la convergence 
uniforme, et nous montrerons que ces deux types de 
convergence correspondent à deux topologies diffé- 
rentes de l'espace (FE) ou (FE): 

L'ensemble F sera dorénavant supposé être un espace 
métrique. 


Convergence simple 
Nous dirons qu'une suite de fonctions f, converge 
simplement vers une fonction f si, pour tout xE€E, 


fn (x) = f (x) 
ce qui s'écrit : (1) 
VxeE Ve> 0 2meN/Vn>m':dlfn (x), f(x] < &. 


L'on notera que l'entier m ainsi déterminé dépend non 
seulement de = mais aussi de x. Cette notion de conver- 
gence correspond à la topologie produit de l'espace FE. 
Cette topologie n'est pas métrisable, car elle ne peut pas 
être définie à l’aide d’une distance (sauf si l'on se res- 
treignait aux fonctions bornées) ; par contre, nous verrons 
plus loin qu'il est possible de la définir à l'aide d'une 
famille de semi-distances. 


Convergence uniforme 

Nous dirons que la suite de fonctions f, converge 
uniformément vers la fonction f si l'entier m déterminé 
dans l'expression (1) peut être choisi indépendamment 
de x. 

Ce qui s'écrit: 


VxEeE Ve>0 2meN Vn>mi:d(fn (x), f(x) < € 


Si les f, et / sont des fonctions bornées, cette expression 
peut s'écrire : 


Vs> 0 2meN Vn>m:5(fnf)< =. 


Dans ce cas, la convergence uniforme n'est autre que la 
convergence des points f de l'espace métrique (FE)s 
vers le point f. 

La convergence uniforme entraîne, bien sûr, la conver- 
gence simple. Mais la réciproque est fausse, ainsi qu'en 
témoigne le contre-exemple suivant : soit la suite de fonc- 
tions f, de R — R définie par: 
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À Figure 1 : 

graphe de la fonction 
énoncée dans le texte 
ci-contre. 


0 x < 0 
2 n? Gex 
fn (x) = : 1 1 1 
28 (x—;) ‘Fan 
0 Re 


Le graphe de cette fonction est donné par la figure 1. 

On montrera que la suite de f, converge simplement 
vers la fonction 0. Par contre, elle ne converge pas uni- 
formément vers O puisque 


8 (fn, 0) = Sup [fn (x) — 0| = 


XeR 


D = +: 


La principale vertu de la convergence uniforme est 
qu'elle « conserve » la notion de continuité par passage 
à la limite ; en d'autres termes, on démontre que : /a limite 
uniforme d'une suite de fonctions continues est continue. 
L'énoncé d'un tel résultat suppose que l'espace de 
départ E soit un espace topologique (de facon à pouvoir 
parler de fonctions continues de E — F). La convergence 
uniforme est essentielle dans la démonstration de ce 
résultat : considérons parexemple la suite des fonctionso,: 
[0,1], —R définie par ox (x) = x*; wo est continue 
pour tout » et converge simplement vers la fonction 
discontinue définie par : 


[?(x)=0 

lLop(1)=1. 

D'un point de vue topologique, ce résultat exprime le 
fait que dans l'espace (FE)», le sous-espace (FE): des 


applications bornées et continues est fermé pour la 
topologie de la convergence uniforme. 


0O<x<1 


Espaces vectoriels topologiques 


Définition 

Un espace fonctionnel est le plus souvent un espace 
vectoriel ; ainsi que nous venons de le voir, il est possible 
de le munir d’une ou de plusieurs topologies. L'on choi- 
sira la topologie la mieux adaptée au problème que l'on 
veut résoudre, sachant qu'il ne sera pas toujours possible 
d'en trouver une qui soit métrisable (voir 7opologie de 
la convergence simple). Ainsi donc, le cadre conceptuel 
de l'analyse fonctionnelle se révèle être naturellement 
celui des espaces vectoriels topologiques. Étant donné 
un espace vectoriel, il s’agit de déterminer quelles rela- 
tions de compatibilité doivent exister entre sa structure 
algébrique et la structure topologique dont on souhaite 
le munir. Nous verrons qu'un espace vectoriel topolo- 
gique n'est pas un espace vectoriel muni de n'importe 
quelle topologie. 

Les espaces vectoriels sont en général de dimension 
infinie. C'est dire l'importance qu'il faut attacher au 
théorème de F. Riesz qui donne une caractérisation 
topologique des e.v.t. de dimension finie. Soit donc 
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un espace vectoriel E muni d'une topologie G (métri- 
sable où non). On dira que E est un espace vectoriel 
topologique si 


Ra > > > > 
l'addition (XY)EEX EE x—+y 


Ets : 5 = " > 
et la multiplication (x, x) ER x E—2:x 


sont des applications continues à valeur dans E. On dira 
alors que la structure vectorielle est compatible avec la 
structure topologique. 

Nous avons rencontré en topologie des espaces vecto- 
riels normés; il est réconfortant de constater qu’un espace 
vectoriel normé est un espace vectoriel topologique. Ceci 
tient aux deux inégalités : 


[lex + ne (@ + à) | < 
l JAY — 08 | < [A — à + [el (X— 3] 


k—a1+—21x YeE 
x,a€R. 


La première permet d'établir la continuité de l'addition, 
la seconde celle de la multiplication. 


> 
Propriétés des voisinages de O 
dans un espace vectoriel topologique 


Voyons comment l’ensemble des voisinages de l'ori- 


ee 
gine © suffit à caractériser la topologie de l'espace. 
Cela tient au fait que la structure vectorielle induit une 
sorte de « solidarité » entre tous les points de l'espace et 
qu'ainsi « ce qui se passe » à l'origine préfigure « ce qui 
se passe ailleurs ». Définissons préalablement ce que 
l'on appelle une partie équilibrée et absorbante de E 
(fig. 2). 

Une partie À d’un espace vectoriel est dite équilibrée 

> 

si, quels que soient ÀER avec |x| <1etxeA,ona 


= 
ÀxE À; géométriquement, on peut dire qu'une partie 
est équilibrée si elle contient la totalité du segment joi- 


> > 
gnant tout point x à son symétrique — x. 
& 
A sera dite absorbante si, pour tout x, il existe un 


nombre « > O tel que VA: |A] < « entraîne xx € A; 
c'est-à-dire qu'il est alors toujours possible de « faire 
rentrer » nimporte quel point de E dans A par une homo- 
thétie de rapport suffisamment petit. 

Nous allons montrer que la topologie de E est entière- 
ment caractérisée par la donnée d'une famille de voisinages 


&. 
de © équilibrés et absorbants. Ce résultat s'énonce sous 
la forme d'un théorème : 


Théorème : soit F (2) l'ensemble de tous les voi- 
> 
sinages d'un point a de E; alors : 
= + > _ + 
(2) F (4) =a+% (0); 


ES > 
(3) tout voisinage V ES (0) est absorbant; 
(4) ÿ/ existe un système fondamental de voisinage 
> 
de O équilibrés. 

Le (2) signifie simplement que l'on obtient n ‘importe 
quel voisinage Va de ä en faisant subir la translation à 
à un voisinage V, de l'origine. 

Pour démontrer (3) il suffit d'écrire que la multiplica- 
tion par un scalaire est une opération continue de 
R x E—E. Démontrons le dernier item plus en détail : 


soit V un voisinage de Ô: montrons que l'on peut trouver 
un voisinage W de O, équilibré, inclus dans V (cf. Topo- 


> > à 
logie). L'application (x, x) + À * x est continue à l'ori- 
gine : quel que soit donc le voisinage V de O, il existe 
x > O et un voisinage Wi de O tel que AW. soit inclus 


dans V pour tout À tel que || < x. PosonsW = | | 2Wi; 
PAl< & 

W est bien sûr un voisinage de O inclus dans V; il nous 

reste à montrer qu'il est équilibré : soit zeW:; montrons 

que Vu tel que |u| < 1, uzE W. D'après la définition 

de W, il existe À (|A] < «) et xeWi tels que 


> > > 
Z=À"Xx; uzZ= À°ux. 


Or |A] <uæet [u] < 1 entraînent que [x ‘ u] < œ et donc 
que uzeW. W est donc un voisinage équilibré de ô. 

De ce résultat fondamental, on peut tirer un certain 
nombre de conclusions : en particulier, on montrera que si 
une application linéaire d'un e. v.t. E dans un autre F 


ensemble équilibré 


et absorbant et absorbant 


est continue à l'origine, elle est continue partout. Cette 
proposition est spécialement intéressante pour des 
espaces de dimension infinie (en dimension finie, toute 
application linéaire est nécessairement continue). 


Espaces vectoriels topologiques 
de dimension finie 


Dans le cas des espaces de dimension finie, tout devient 
notablement plus simple : il existe alors une seule topolo- 
gie compatible avec la structure vectorielle et séparée 
(voir Topologie). Cette topologie sera dite « topologie 
canonique » ; elle se définit à l'aide d'une norme. 

Le théorème suivant (dû à F. Riesz) établit une carac- 
térisation des espaces de dimension finie (dans l'espace 
vectoriel de dimension finie R?, il y a identité entre les 
parties compactes et les parties fermées et bornées — ce 
qui n'est plus le cas en dimension infinie). 

Théorème : pour qu'un espace vectoriel topolo- 
gique E soit de dimension finie, il faut et il suffit qu'il 
soit localement compact. 

Il convient de noter que ce résultat établit une équiva- 
lence entre une propriété de nature algébrique (dimension 
finie) et une propriété de nature topologique (la locale 
compacité). Donnons les grandes lignes de la démons- 


tration (fig. 3) : soit V un voisinage compact de Ô dans 
E.2 V possède, bien sûr, les mêmes propriétés. Soit un élé- 
ment quelconque de l’ensemble 2 V; à — Ÿ est un voisi- 
nage ouvert de 3; en outre, lorsque ä parcourt 2 V, les 
3 — Ÿ constituent un recouvrement ouvert de 2 V : 


Richard Colin 


ensemble non équilibré 


ensemble 
non absorbant 


et non équilibré 


ensemble 
non absorbant 


et équilibré 


2Vc || G@+V 
Zeav 
D'après l'hypothèse de compacité, on peut en extraire 
un recouvrement fini (voir Topologie), c'est-à-dire qu'il 


existe des éléments a 2, _ 5 tels que : 


2Ve w + Vo). 
i=1 

Soit M le sous-espace vectoriel engendré par les &;; 
il est de dimension finie (au plus n) et M + Vrecouvre 2 V. 
La démonstration s'achève en montrant qu'en réalité M 
coïncide avec l’espace tout entier E qui, du même coup, 
se trouve être de dimension finie. 

Ce théorème donne une idée des difficultés que l'on 
peut rencontrer en analyse fonctionnelle : les espaces 
de fonctions étant de dimension infinie, ils ne sont pas 
localement compacts. Aussi bien, il sera plus délicat 
d'obtenir des convergences de suites de fonctions (puis- 
qu'il y a « moins » de compacts...). On déduit de ce théo- 
rème que tout sous-espace vectoriel de dimension finie 
est nécessairement fermé dans E. 


Espaces vectoriels semi-normés 


Considérons l’ensemble FE des fonctions de E dans F 
lorsque F est un espace vectoriel normé. Nous avons défini 
sur cet espace la topologie de la convergence simple dont 
nous avons vu qu'elle n'était pas normable. Nous allons 
généraliser la notion d'espace normé en définissant celle 
d'espace semi-normé. Nous montrons que l'espace vec- 
toriel topologique FE est un espace vectoriel semi- 
normé. 


Définition et propriétés élémentaires 
Une semi-norme sur un espace vectoriel E est une fonc- 


tion p : E — R+ qui possède les trois propriétés suivantes : 
(5) _p (x) > 0; pr(Ô) = VxeE 

> > > 
(6) p (À x) = [Al p (x) VxeE,reR 


(7) pi <p(d+p(y VXyeE. 


Seule la première de ces propriétés distingue une semi- 
norme d'une norme : en effet, il est possible d'avoir 


LS > a 
p (x) = O0 avec x 0. E sera dit semi-normé s'il est 
muni d'une famille de semi-normes (pi);e r (que l'on 
notera | |;). Grâce à la donnée de cette famille, on peut 
munir E d'une topologie ,9n appellera semi-boule 


ouverte Bi (&, R) de, centre d et de rayon R = 0 l'en- 


semble B: (4, R) ={X€E | IX — 3 k < R}. 
Ainsi donc, une partie O de E sera dite ouverte si, 


Fe 
pour tout point a de O, il est possible de trouver une semi- 
> 
boule de centre a entièrement contenue dans 0; 
> 
VaecO02Eel et => 0 telsque B: (a &) € O. 


On montrera sans peine que les axiomes des ouverts 
sont bien satisfaits. || est nécessaire de supposer pour 
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« Figure 2 : 
représentation graphique 
d'une partie équilibrée 

et absorbante de E. 


<« Figure 3: 

voir dans le texte 

la démonstration 

du théorème de Riesz 
de dimension finie. 
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A Figure 4: 

forme géométrique 
(théorème de séparation) 
du théorème 

de Hahn-Banach. 


Y Figure 5 : 
ensemble convexe 
d'un espace vectoriel 
topologique. 


[e 


| 
| 
| 
| 
| 
! 


cela que la famille des |pli (ie n est filtrante, c'est-à-dire 
telle que, pour toute partie J & I, il existe K tel que 
pr > Pi Vie J. Il est toujours possible de se ramener 
à ce cas-là en ajoutant aux (p:) les sommes finies > P; 
jes 

(voir 7opologie). 

Nous ne considérons que des espaces semi-normés 
dont la topologie est séparée : pour cela, il est nécessaire 
d'ajouter la condition supplémentaire : 


VxZ£0 el [Xkx 0. 
Dans un espace semi-normé, la convergence s'exprime 
de la manière suivante; nous dirons que Xn x si 
Viel,Vs> 0 3N (4e) 
tel que n > N (4€) Ie — X Îk < € 


D'autre part, la continuité d'une application linéaire 
d'un espace normé dans un autre s'exprime sous la 


> > 
condition : |f (x) |r < & [x|# où £ est une constante 
positive. Lorsque l'espace de départ E est semi-normé, 
cette condition se généralise de la manière suivante : 
pour que f soit continue, il faut et il suffit qu'il existe une 
semi-norme | |; et une constante k telles que : 


IF CO le < 4 1x. 


Enfin la topologie définie à l’aide d'une famille de semi- 
normes est compatible avec la structure vectorielle de 
l'espace : un espace semi-normé est un espace vectoriel 
topologique. D'autre part, on peut se restreindre aux seules 
semi-normes continues (en tant qu'applications de 
E — R+) qui caractérisent la topologie. 

Voyons maintenant comment ces notions permettent 
de décrire les topologies de certains espaces fonctionnels 
parmi les plus courants. 


Exemples d'espaces vectoriels semi-normés 


Considérons l'ensemble © (R, R) des fonctions conti- 
nues de R dans R. Nous allons voir que cet espace fonc- 
tionnel peut être muni de deux topologies, chacune 
d'elles faisant de lui un espace semi-normé. 


ensemble non convexe 


ensemble convexe 


Âo.5. 
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Convergence simple 
On peut définir une famille de semi-normes de la 
manière suivante : 


lflz = f(x) xeR. 


On vérifie que les | |: constituent une famille de 
semi-normes et qu'en outre la topologie qu'elle définit 
est séparée : 


fl = OVx= f(x) = 0Vx=f=0. 


Dire enfin que la suite , de C (R, R) converge vers f 
par la topologie des semi-normes, c'est dire que : 


Îfn — f|x — 0 Vx ou encore que fn (x) — f (x) 


c'est exactement dire que , converge simplement vers f. 

Pour que la famille de semi-normes soit filtrante, il est 
nécessaire de lui adjoindre d'autres semi-normes cons- 
truites à l’aide des parties finies de R : ainsi donc, soit 
l'ensemble des parties finies de R : 


F={ACR| Card A < cw} 


la famille de semi-normes qui définit la topologie de la 
convergence simple est donc la suivante : 


Ifla = Sup|f(x)| Ae. 


Convergence compacte 
Soit X l'ensemble des parties compactes de R. Pour 
tout compact Ke X, on définit : 
fix = Sup |f (x)|. 


XEK 


Comme f est continue et K compact, cette expression a 
un sens. II s’agit d'une semi-norme. Lorsque K parcourt, 
ces semi-normes définissent sur C (R, R) une autre struc- 
ture semi-normée. 
Ces deux exemples montrent que, sur un même espace, 
il est possible de définir deux topologies compatibles 
avec la structure d'espace vectoriel. Comme # € X, 
la topologie de la convergence compacte Gc est plus 
fine que la topologie de la convergence simple Gs. 
Cela signifie notamment que : 
— tout ouvert À pour Gs est ouvert pour Gc: 
— une suite de fonctions f, qui converge pour la 
topologie Gc converge également pour la topologie Gs. 


Espaces localement convexes - 
Théorème de Hahn-Banach 


Nous introduisons ici la notion de convexité. Nous 
montrons en premier lieu qu'un espace convexe est 
toujours semi-normable (et réciproquement). En second 
lieu, nous établirons le théorème de Hahn-Banach qui 
peut s'énoncer sous deux formes : une forme analytique 
(il s'agit d'un théorème de prolongement) et une forme 
géométrique (théorème de séparation). Sous sa forme 
géométrique la plus connue (fig. 4), il exprime l'idée 
intuitive selon laquelle, dans R3 par exemple, il est pos- 
sible de « séparer » un convexe Q et une droite D ne 
rencontrant pas Q au moyen d’un plan P — la convexité 
est ainsi une notion essentielle au théorème de Hahn- 
Banach. 


Ensembles convexes 
d'un espace vectoriel topologique 


Soit C une partie (Æ S) d'une. v.t. E; on dira que C 
est convexe s'il vérifie la propriété suivante : quels que 


: : > — La 
soient les points a1, 42, …, am de C et les nombres À, …, Am 


m m 
> Ca 
positifs et tels que > A = 1, le point a — > Mai 
i=1 i=1 
appartient encore à C (fig. 5). On démontre qu'il suffit 
que cette propriété soit vérifiée pour deux points seule- 
ment. Dans R?, géométriquement, cela signifie que le 
segment joignant deux points quelconques de C est 
entièrement contenu dans C. 
Considérons une partie À quelconque de E; l'intersec- 
tion de tous les convexes qui contiennent À est encore 
un convexe (fig. 6); c'est le plus petit convexe conte- 


nant À, et on l'appelle enveloppe convexe de À (notée À) : 
on démontre que 
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OH Hi | 


Al walaæeAimenN M>0 > 4 


i=1 i=1 
Lorsque E est un espace vectoriel topologique, on peut 
établir quelques résultats, notamment : si C est un convexe, 


Le 
l'adhérence C et l'intérieur C sont également convexes. 


Espaces vectoriels topologiques 
localement convexes 


Nous dirons que E est localement convexe s'il admet un 

2 

système fondamental de voisinages de l'origine O 
ee 

convexes. Autrement dit, si tout voisinage V de O contient 


a 
au moins un voisinage V’ de O convexe. 

Énonçons le résultat : pour qu'un espace vectoriel 
topologique soit localement convexe, il faut et il suffit 
qu'il soit semi-normable. 

Il est d’abord clair qu'un espace semi-normable est 


Se 
localement convexe : soit V un voisinage de O, il contient 
au moins une demi-boule B; (0, R), laquelle est, bien 
sûr, convexe. La réciproque est plus délicate à établir : 
elle consiste à construire une famille de semi-normes à 


re 
partir d'un système fondamental de voisinages de O 
convexes et équilibrés (nous avons vu dans les Espaces 
vectoriels topologiques que l'on pouvait en trouver). 
Soit Q un tel voisinage, on cherche alors une semi- 
norme po telle que Q soit la semi-boule unité ouverte 
pour cette semi-norme 


Q = {| pa (9 < 1} 


Si l'on parvient à définir une telle semi-norme, il est 
clair que l’on aura montré que la topologie de E est définie 
par la famille de semi-normes pa où Q parcourt l'ensemble 


e 
des voisinages convexes, équilibrés et ouverts de O. 

A tout convexe C on peut associer une fonction jc, 
appelée jauge du convexe C, définie par : 


je = inf{fk;:k > 0|XE4Q)} 


Cette définition signifie que k > jc % << À eC: 


On démontre que, lorsque ( est un ouvert convexe équi- 
libré, la jauge associée est une semi-norme continue et 
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# 
qu’en outre Q = {x | ja (x) < 1}. Autrement dit, la semi- 
norme cherchée n'est autre que la jauge de Q (le fait que Q 
soit équilibré est essentiel pour établir les axiomes de défi- 
nition d'une semi-norme). 


Forme analytique du théorème de Hahn-Banach 


Sous sa forme analytique, le théorème de Hahn- 
Banach est un théorème de prolongement. Qu'est-ce 
à dire? Soit f: A+ F, on appellera prolongement de f 
à un ensemble B = A une fonction f: Bt E qui coïncide 


avec f sur A. Autrement dit telle que À (x) = f (x) Vxe A. 
Dans tous les théorèmes de prolongement que l'on ren- 


contre en analyse, on cherche un prolongement f qui 
conserve certaines propriétés de f (par exemple conti- 
nuité, linéarité, etc.) [fg. 7]. 

Le théorème de Hahn-Banach est un théorème de nature 
essentiellement vectorielle, et on n'y fait intervenir aucune 
hypothèse topologique. C'est précisément là que réside 
son intérêt puisqu'il peut être appliqué aux espaces de 
dimension infinie. Il n'en reste pas moins que l'on en 
déduira certaines propriétés topologiques dans le cas des 
espaces localement convexes. 

La démonstration s'articule en deux étapes : dans un 
lemme préalable, on montre que l’on peut prolonger la 
fonction f à un espace possédant une dimension supplé- 
mentaire; puis, grâce au fameux théorème de Zorn, 
on en déduit le prolongement à l'espace entier. 

E est un espace vectoriel et p une semi-norme, F un 
sous-espace de E de codimension 1 (voir A/gèbre linéaire), 
et / une forme linéaire définie sur F. (f:F = R) et telle 


que f (x) < p Go VxeF; il existe alors au moins une 
forme linéaire f définie sur E tout entier, prolongeant f 
_ > > 

et telle que VxeE f(x) < p (x). 

F est un hyperplan, autrement dit E — F @ D où D 
est une droite (dimension 1). 

Soit x1 un vecteur de D, donc é F (fig. 8). Tout élément 
X de E s'écrit d'une manière unique sous la forme 


> Le > 
X= AX1 T Ÿÿ 
& à 
oùxeRetyeF. Une forme linéaire f sur E prolongeant f 
s'exprime sous la forme générale suivante : 


= > à > Se 
FH) =tirf(y) oùf(x) =teR 
peut être choisie arbitrairement. La démonstration s'achève 
en déterminant t afin que f soit aussi majorée par p, c'est- 
à-dire telle que 
> x > Mes ” > 
f(Y)+xt<p(y+àx) VreR,yerF 

Donnons l'énoncé du théorème de Hahn-Banach : 

Théorème : soit E un espace vectoriel et p une 
semi-norme, F un sous-espace vectoriel quelconque de E, 
f une forme linéaire définie sur F et telle que 

> La > 
f (M) <p(X,VxerF. 
Il existe alors une forme linéaire (non nécessairement 
unique) définie sur E tout entier, prolongeant f et telle 
> > > 

que f(x) <p (x) VxEeE. 

Utilisons donc le théorème de Zorn : 

Théorème : soit X l'ensemble des couples (G, g) 
où G est un sous-espace contenant F, et g un prolonge- 


ment de f au sous-espace G et majoré par p sur G. On 
définit sur X une relation d'ordre < de la manière suivante : 


(G1, g1) < (G2,g2) si G2 > Gi 
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<« Figure 6: 
on appelle enveloppe 


convexe de À (notée À) 
le plus petit convexe 
contenant A. 


Y A gauche, figure 8 : 
voir démonstration dans 
le texte. 

À droite, figure 7 : 

dans tous les théorèmes 
de prolongement 

que l’on rencontre 

en analyse, on cherche 
un prolongement f qui 
conserve certaines 
propriétés de f. 
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A Figure 9: 

exemple d'une application 
du théorème 

de Hahn-Banach 


sous sa forme géométrique. 
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y Figure 10 : 

notion d'intérieur relatif 
(voir développement 
dans le texte). 


et si g2 est un prolongement de g1. X est évidemment un 
ensemble ordonné et non vide car (F,f) € X. 

On montre sans peine que X est un ensemble inductif 
(voir Ensembles). 

Le théorème de Zorn conclut à l'existence d'un élément 


maximal (E, f). Utilisons le lemme précédent et montrons 
que E1 = E : supposons que E1 soit Æ E, alors il existe 


16 Ex. Soit E2 le sous-espace engendré par E1 et A 
E1 est un hyperplan de E2; d'après le lemme, on pourrait 
prolonger f à Ez, et, de ce fait, (E1, ) ne serait plus maximal. 

Remarque : dans l'énoncé du théorème, on peut 
remplacer l'inégalité 7 (x) < p (x) par l'inégalité 

IF (I < p (x). 
Ces deux inégalités sont équivalentes : en effet, 
F(— x) < p (— x) = p (x) 

(p étant une semi-norme), soit f (x) > — p (x), c'est-à- 
dire |f (x)| < p (x) Yx. 

Examinons ce que l’on peut déduire de ce théorème 
lorsque E est un espace vectoriel topologique : si l'appli- 
cation linéaire f et si la semi-norme p sont continues, 
alors le prolongement f de f est lui aussi continu. 

De cette première conséquence, on peut tirer le 


résultat suivant : si E est localement convexe, F étant un 
sous-espace de E, f une forme linéaire continue sur F, 
alors il existe une forme linéaire continue f sur E prolon- 
geant f : E est en effet alors semi-normable. Dire que f est 
continue sur F signifie qu'il existe une semi-norme (conti- 
nue) p:; et une constante 4 > 0 telles que 


f(x)! < kp: (X) VxEF. 
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Il existe donc un prolongement f continu satisfaisant à la 
même inégalité. L'hypothèse de continuité est essentielle 
à la démonstration : elle ne suffit pas seulement à assurer 


la continuité de f, mais elle est tout à fait indispensable 
pour en établir l'existence même. 

Remarque : le théorème de Hahn-Banach est égale- 
ment vrai lorsque p est seulement une sous-norme. Une 
sous-norme, comme une semi-norme, vérifie la semi- 
positivité, ainsi que l'inégalité de convexité (propriétés 
(5) et (7) de la définition du paragraphe : Définitions 
et propriétés élémentaires). Par contre, la propriété (6) 
n'est exigée que pour les homothéties de rapport > 0: 


p(OX=2P(X VA> 0. 


On montre que la jauge d'un convexe ouvert Q est 
une sous-norme; elle est en plus une semi-norme si et 
seulement si Q est équilibré. De cette expression plus 
générale du théorème de Hahn-Banach, l’on peut déduire 
sa forme géométrique. 


Forme géométrique 
du théorème de Hahn-Banach 


On montre en algèbre qu'un hyperplan H de E (sous- 
espace de codimension 1) peut toujours se définir comme 
le noyau d'une certaine forme linéaire f : 


H={XeE| f(x = 0}. 


On démontre alors que H est fermé ou dense dans E 
suivant que f est continue ou non. De même, un hyper- 
plan affine H}(c'est-à-dire le translaté d'un hyperplan H) 
se définit à l'aide d'une forme linéaire f et d'un nombre c 
> > 
de la manière suivante :(D= XF (x) = c}:) sera 
fermé ou dense dans E suivant que f est continue où non. 
En outre, on établit qu'il existe une seule forme linéaire f 
> > 

telle que = {x|f (x) = 1}. Ces quelques résultats 
liminaires vont nous permettre de démontrer la forme 
géométrique du théorème de Hahn-Banach : 

Théorème : soit Ë un espace vectoriel topologique, 
Q un ouvert non vide, M un sous-espace affine non vide 
ne rencontrant pas (. Alors il existe au moins un hyper- 
plan fermé affine(H)contenant M et ne rencontrant pas 
non plus Q. 

Nous illustrerons l'énoncé et la démonstration du théo- 
rème à l’aide de l'exemple géométrique suivant : prenons 
pour E le plan R2, pour Q le disque ouvert de rayon 1 


>, > 
et pour M le point de coordonnées (1, 0).Q = {x| x || < 1}, 
donc {M} N Q = g. M est un sous-espace affine 
(de dimension O!). Le théorème permet de conclure à 
l'existence d'une droite tangente à Q au point M... 
Démonstration du théorème (fig. 9) : Q étant non vide, 
il est toujours possible de se ramener, par translation, 


> . 
au cas où 0e Q; soit p la jauge de Q (laquelle est une 
sous-norme) ; elle est de plus continue (dans l'exemple 
donné, p est la norme euclidienne). Soit F le sous- 


% 
espace vectoriel engendré par M. Comme 0 é M, M est 
un sous-espace affine et non vectoriel. M est donc stric- 
tement inclus dans F (dans l'exemple, F est l'axe des x1), 
et de plus M est un hyperplan affine de F. Il existe donc 
une forme linéaire unique sur F telle que : 
> > 
M={x] f(x) = 1} 

(dans l'exemple, f:(0,x1)+H x1). Démontrons que 
> > > > 

xeF—=f(x) < p (x). SoitxeF; deux cas peuvent se 


> > 
présenter : ou bien f œ est < 0, et alors f (x) < p (x) 
puisque p est > 0, ou bien f (x) est > 0; il existe alors 


un nombre À = f GO tel que f er = 1, soit 1x € M, 
d'où 1x Q. C'est-à-dire p (XX) > 1 = f (XX), d'où l'on 
conclut p (* > # (©, dans ce cas aussi. Finalement 
FH <p(X VreF. 

D'après le théorème de Hahn-Banach sous sa forme 
analytique, il existe une forme linéaire fsur E, prolongeant f 
et telle que F(% < p es) VxeE [dans l'exemple, 
À est l'application (x1, x2)H> x1]. L'équation f %) 1 
définit un hyperplan affine fermé H (Fest continue) qui 
contient M. 


Si XeQ, F (© < p es < 1, alors XÉ H; donc Q ne 


rencontre pas non plus H (dans l'exemple, H est la droite 
d'équation x1 = 1, c'est-à-dire la tangente en M au 
cercle de centre O et de rayon 1). 

Ce théorème permet d'obtenir de nombreux résultats 
en dimension finie, très utiles en optimisation linéaire et 
convexe. Donnons ici deux résultats : 

__ Soit C1 et C2 deux convexes non vides de Rz. 
Pour qu'il existe un hyperplan séparant Ci et C2, il faut et 
il suffit que les intérieurs relatifs de C1 et de C2 soient 
disjoints. 

Précisons la notion d'intérieur relatif (fig. 10) : on 
appelle intérieur relatif d'une partie À de R* l'ensemble 
Ri (A), intérieur de À par rapport au sous-espace affine 
engendré par À. Exemple : À est un disque dans R3; 


il est clair que À est Z. Par contre, l'intérieur relatif de À 
est l'intérieur de A par rapport au plan p : c'est donc 
l'ensemble des points de A non situés sur le cercle. 

Ce théorème prouve donc l'existence d'un hyperplan H 
d'équation f (x) = b tel que : 

—_ _ — — 
f()<b<f(e) VXieC1 Vx2e C2 (noter les iné- 
galités au sens large). 

— Soit C un convexe non vide fermé, et K un 

convexe compact non vide de R? disjoints, alors il existe 


un hyperplan H d'équation f (© — b qui les sépare 
strictement 


FU <b<r(f Viec, Vkek. 


La dualité dans les espaces normés 


L'idée de dualité est présente dans un grand nombre de 
résultats aussi bien d'algèbre que d'analyse, même si elle 
n'est pas toujours explicitée. Depuis longtemps, les 
mathématiciens avaient conscience que certains pro- 
blèmes pouvaient susciter deux approches étroitement 
liées l’une à l’autre, deux approches en « dualité » dans 
un sens très intuitif qu'ils ont cherché à formaliser : il 
faudra attendre le XX®° siècle et les travaux de Banach 
pour qu'elles reçoivent une formalisation rigoureuse. 

Ainsi, une courbe plane peut être considérée sous deux 
aspects différents : 

(a) soit comme l'ensemble de ses points liés par une 
équation y = f (x); 
(b) soit comme l'enveloppe de ses tangentes. 

Deux points de vue différents, certes, mais que l'on sent 
doués d'une évidente complémentarité : suivant la nature 
du problème que l'on souhaite résoudre, on privilégiera 
un point de vue particulier en espérant que la résolu- 
tion en sera plus aisée. Soit à résoudre, par exemple, le 
problème suivant (ô combien classique!) : « trouver 
les extrema de la fonction y — f (x) ». L'approche (a) 
se révèle n'être d'aucun intérêt puisqu'elle obligerait à 
calculer toutes les valeurs prises par la fonction afin de 
trouver celles qui fournissent les extrema (1); l'approche 
(b) est, à l'évidence, la plus féconde puisqu'elle stipule 
que les extrema correspondent aux points où la tangente 
est horizontale. 

Un tel exemple montre l'intérêt qui peut exister à 
développer la notion de dualité (déjà évoquée en Algèbre 
linéaire) dans les espaces de fonctions. Appliquée aux 
espaces vectoriels topologiques, elle fournit un cadre 
propice à la résolution de certains problèmes d'analyse 
fonctionnelle. En outre, elle permet d’expliciter les fonde- 
ments de la théorie de la mesure et de la théorie des dis- 
tributions. Pour plus de simplicité, nous restreindrons notre 
étude aux espaces normés. 


Dual topologique d'un espace normé E 


On appelle dual topologique de E l'ensemble E’ de for- 
mes linéaires continues sur E. E’ est bien évidemment un 


espace vectoriel. Soit e’ un élément de E’; on convient de 
< + 
noter <e’, eÿ la valeur prise par la forme linéaire e’ au 
ë L 2 + à r rés 
point e [ou e’ (e)]. Cette notation met en évidence la 
symétrie qui existe entre l'espace E (le primal) et son 
dual E’. L'application de E x E’- R définie par 
< > <, >, 
(ee) <e’, e} 
est une application bilinéaire que l’on appelle également 


> < 
le produit scalaire de ee Eetdee’€ E par analogie avec 
l'exemple géométrique suivant : 


Exemple : cas de la dimension finie R? 
Le dual R’* de R? est l'ensemble des vecteurs 


‘ æ = : 
lignes R?* = {a — (a1, …, an) | & € R}. Soit x un vec- 


X1 
teur de R?, x — | ; j La valeur prise par la forme linéaire 
Xn 


< ; > z 
a au point x est donnée par : 


< > X1 Le 
<a, X> = (a1, …, 87) | E | = bi aiXi. 


Xn ET 


. ee . . 
Géométriquement, <a, xÿ est le produit scalaire des vec- 
> 


& 
teurs af et x. 

En dimension finie, toutes les applications linéaires sont 
continues ; il y a donc coïncidence entre le dual algé- 
brique (ensemble de toutes les formes linéaires, conti- 
nues ou non) et le dual topologique. Cette coïncidence 
n'existe plus en dimension infinie. E’ étant un espace 
vectoriel, il est naturel de chercher à en faire un espace 
vectoriel topologique ; grâce à la relation de dualité qui 
le lie à E, il est possible de le munir de deux topologies 
différentes : la topologie forte et la topologie faible. 

— Topologie forte du dual : on appelle topologie 
forte de E’ la topologie de la convergence uniforme sur les 
parties bornées; cette topologie est définie à l'aide de la 
norme : : e 

léls= Sup [el 
Ilélle < 1 


. . . Æ 
Cette expression a un sens unique puisque e’ est une 
forme linéaire continue (c'est-à-dire qu'il existe À > O 


< > > 
tel que |<e’,e>| < A | e). L'espace E’ est un espace 
normé complet (puisque R l'est) ; c'est donc un espace 
de Banach. 

— Topologie faible du dual : on appelle topologie 
faible de E’ la topologie de la convergence simple. Il 
s'agit d'une topologie semi-normable qui, ainsi que nous 
l'avons déjà vu, est définie par la famille de semi-normes 

< > 
pa (e’) = Sup [<e’, e»| où A est une partie finie de E. 
e£A 
C'est une topologie séparée; en outre, c'est la moins 
finie des topologies compatibles avec la structure vecto- 
rielle et qui rendent continues les formes linéaires sur 


< << > > 
E’e’ <e’, eÿ pour toute € E. Il est clair que la topologie 
forte est plus fine que la topologie faible. 

Les espaces E et E’ sont doués d'une certaine symétrie 
au niveau de leurs structures vectorielles. Nous allons 
donc compléter cette symétrie en définissant une topo- 
logie affaiblie sur l'espace E qui sera l’analogue de la 
topologie faible de E’. L'espace E aura donc lui aussi 
deux topologies : la topologie initiale (ou topologie forte 
du primal) et cette topologie affaiblie. 


Topologie affaiblie du primal 
On appelle topologie affaiblie de E la topologie définie 
> < > 
par la famille de semi-normes pa (e) — Sup [<e’, e)l 
£'eA 


où A’ est une partie finie de E’. On note cette topologie 
o (E, E’) : cette notation signifie qu'il s'agit d'une topo- 
logie sur E définie par des semi-normes construites à 
l'aide d'éléments de £’ [on vérifiera ainsi que la topologie 
faible du dual E’ est la topologie © (E’, E)]. On notera 
Es l'espace E muni de la topologie © (E, E’). Il est possible 
alors de considérer le dual topologique de Es, c'est-à- 
dire l’ensemble des formes linéaires sur E, continues pour 
la topologie affaiblie de © (E, E’). 

La topologie forte de E (topologie initiale) étant plus 
fine que la topologie o (E, E’), il est clair que toute forme 
linéaire faiblement continue (c'est-à-dire continue lors- 
que E est muni de la topologie affaiblie) sera fortement 
continue, autrement dit (Ec)' & E”’. Inversement, soit e” 
une forme linéaire fortement continue, élément de E’; 
elle est, à l'évidence, faiblement continue puisqu'on a 
l'inégalité : 


1K, 85] < pé (@) VéeE oùpé (8) = |<e.e)] (1) 


Ainsi donc, (Es) = EF’. La topologie © (E, E’) est ainsi 
la topologie la moins fine compatible avec la structure 
vectorielle et pour laquelle E’ est encore le dual topolo- 
gique de E. 
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F. Arborio Mella 


À Le mathématicien 
allemand David Hilbert 
(1862-1943). 


Dualité faible entre E et E : soit é un élément de E; 
= < < + 

l'application e:e’ EE’ <e’,e> est une forme linéaire 

sur E’, continue pour la topologie faible & (E’,E). C'est 

donc un élément du dual topologique de l'espace Es. 


En identifiant la forme linéaire e et l'élément e (voir 
Algèbre linéaire), on peut écrire (Es) = E. Grâce à la 
particularité de la topologie faible du dual, on montre 
que cette inclusion est en réalité une égalité. Ce résultat 
illustre bien la symétrie parfaite qui existe entre Es et E’o 
pourlestopologies os (E,E’)eto (E’, E) : chacunest le dual 
de l'autre, et la topologie affaiblie de l'un est la topologie 
faible du dual de l'autre. Cette belle symétrie n'existe plus 
lorsque l’on considère les topologies fortes de E et de E’. 
Ainsi donc, dans le cas général, Æ est inclus seulement 
dans le dual fort de EF’. C'est cette question que nous 
abordons maintenant. 


Bidual : espaces réflexifs 


Munissons donc E’ de la topologie forte; son dual 
topologique se note E” et s'appelle le bidual de E et est 
lui-même muni de sa topologie forte (que l'on définit 
en utilisant la dualité entre E’ et E”. Nous identifierons E 
à un sous-espace de E” par le procédé évoqué ci-dessus 


La 1. 
(au surplus E, étant normé, |e|E — |e|E 
E — E’ = E? … 


On dira que E est réflexif s'il est identique à son bidual : 
EE. 

D'ores et déjà, nous pouvons remarquer une condition 
nécessaire de réflexivité : l'espace E doit être un espace 
de Banach; mais cette condition n'est pas suffisante. 
En réalité, une condition nécessaire et suffisante est 
donnée par le théorème de Banach. 

Théorème : pour qu'un espace normé E soit réflexif, 
il faut et il suffit que sa boule unité soit faiblement 
compacte. 
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Ce résultat est à rapprocher du théorème de F. Riesz 
qui fournit une caractérisation des espaces de dimension 
finie par la compacité (forte) de la boule unité. En dimen- 
sion finie, la topologie forte et la topologie faible coin- 
cident, et la réflexivité est toujours réalisée. Le théorème 
de Banach est ainsi une généralisation du théorème de 
Riesz. Il illustre l'intérêt des espaces réflexifs : que la boule 
unité soit faiblement compacte (ce qui entraine d’ailleurs 
que l'espace est complet) signifie que l’on pourra établir 
certaines convergences (faibles). 

Nous démontrerons seulement un résultat liminaire au 
théorème de Banach qui situe bien la nature du problème : 

Proposition : soft E un espace normé, la boule unité 
de son dual E” est faiblement compacte. 

La topologie faible sur E’ est celle de la convergence 
simple. Autrement dit, il s’agit de la topologie induite 
par l’espace RE de toutes les fonctions sur E à valeurs 
réelles. Pour montrer que B’ est faiblement compacte, 
on démontrera que B’ est inclus dans une partie compacte 
de RE, et qu'en outre B’ est fermé dans RE. Il est clair que 


B'< II À (6) où À (e) — {6,69 | € B'}. À (e) est 
éeA 
un intervalle borné de R : en effet, 
< AGE >, 
ee B’—= [|<e, el < le. 
À (e) est donc un compact de R et, d'après le théorème 


de Tychonoff (voir 7opologie), l'ensemble ITA (e), produit 
de compacts, est compact. 


> > 
Reste à montrer que B’ est fermé dans RE : soit x et y 
des éléments de E, et À et 4 deux nombres réels. Pour 
> > 
x, y, 2, u fixés, la fonction D? >, ?, à : RE — RE définie 
> > > > 
par fi f [2x + uy] — Àf (x) — uf (y) est évidemment 
continue (pour tout zEeE, l'application f+ f (z) est une 
projection de RE sur un de ses facteurs). Donc l'ensemble 
des fonctions f vérifiant ®7, 7, ?, à (f) = 0, image réci- 
proque du fermé {0}, est fermé dans RE. Soit E* le dual 
algébrique de E. Il est clair que : 


E* = N/D, 7, Lu (f) = 0}. 
EE » 
x,YeE, 
kteR 
Autrement dit, E*, étant une intersection de fermés, 


est fermé dans RE. Soit x enfin un élément de E. 

L'application ; de RE dans R définie par F; (f) — 

f (x) — |x| est non moins évidemment continue. 

Par conséquent, l'ensemble Az; = {f| x; (f) < 0} est 

une partie fermée de R (comme image réciproque du 

fermé R-), et l'ensemble A = MN A, l'est également. II 
> 


R eE 

reste à remarquer que B’ = E* \ À, et donc que B’ 
est fermé dans RE, c'est-à-dire faiblement fermé dans E’. 
Ainsi donc, B’ est faiblement compact dans E’. Ce résul- 
tat liminaire intervient dans la démonstration du théorème 
de Banach en remarquant que, si E est réflexif, alors il est 
le dual topologique de E’, et donc, en tant que dual, sa 
boule unité doit être relativement compacte. 

Exemples d'espaces de Banach réflexifs : les espaces 
LP (Rz: R). 

Soit LP (R*; R) l'ensemble de fonction f de R* =R 
p-intégrables (voir Analyse) p e{1,2,., N,.….} LP est 
un espace vectoriel normé pour la norme 


U £Il k 1 
1 Flo = (| ee lf CIE 
On montre que, pour p > 2, le dual de LP est l'espace L2 
: te sell 
où p et g sont liés par l'égalité —- — à = 1. Les espaces L2 


sont donc tous réflexifs pour p > e. Par contre, pour 
p = 1, on montre que son dual est L® (ensemble des 
fonctions presque partout bornées sur R*), mais le dual 
de L® est strictement plus grand que Li. 


Espaces de Hilbert 


Les espaces de Hilbert constituent un cas particulier 
des espaces de Banach réflexifs. Ils sont les espaces vec- 
toriels topologiques les plus « proches » des espaces 
de dimension finie (R* est d’ailleurs un espace de Hilbert), 
car ils présentent un certain nombre de qualités géomé- 
triques il existe un isomorphisme canonique entre 


l’espace et son dual topologique; en outre, il est possible 
de « projeter » sur tout sous-espace fermé. Enfin, on géné- 
ralise la notion de base en définissant une base hilber- 
tienne, composée d'une infinité dénombrable d'éléments. 
Forme bilinéaire 
Soit un espace vectoriel, on appelle forme bilinéaire B 
une application de E x E = KR /inéaire par rapport à 
chacune des variables : 
> > > > > > > > > > 
B (AX1+ ue, y) = ÀB (x1, y) + uB (x2,y) Vx1.x2,YEE 
> > > > > > > > > 
B (X, Aÿ1 + uyo) = ÀXB (x, y1) + uB (x ya) Vy1.Y2X€E 
VrueR 
Une forme bilinéaire est dite positive si 
> 
B(XX)>0 VxeE. 
> > 
Elle sera dite définie positive si, en outre, B (x, x) > 0 
pour x Z 0. Enfin elle sera dite symétrique si 
> > > > 
B (x y) = B (y, x). 
Si B est une forme bilinéaire symétrique et positive, on a 
l'inégalité de Schwarz : 
L > > !l > > + 
[B (x y)| < B (x x)2:B (y. y)?. 
Rappelons-en la démonstration : on peut écrire 
D … ur LE > > 2. > > _— > > 
B (x + 2y, x + 2y) = B (xx) + 22B (x, y) + 2B (y, y) 
avec À € R. Dire que B est positive signifie que : 
> 2 212 à 
B(x+2y,x +2) >0 VreR 
soit que l'équation en 2 : 
> > 2 > + > > 
22B (y, y) + 2XB (x, y) — B (x, x) 
n'a pas de racine réelle, c'est-à-dire 
ë > > > > > > 
A=B2(x y) —B (x x): B (y. y) < 0. 
Espace de Hilbert 
Soit H un espace vectoriel sur lequel on a pu définir 
une forme bilinéaire symétrique, définie positive (ou 
>, > 
produit scalaire que l'on va noter (x| y)). En utilisant 
l'inégalité de Schwarz, on montre que l'application 


> > > 1 : L 
x — (x | x)? est une norme. Si H est complet pour la dite 
norme, on dira que H est un espace de Hilbert. 


Exemples : 
R? est un espace de Hilbert pour le produit scalaire 


n 

+, > 

Gin = D x. 
i=1 


L'espace L2 (R?, R) des fonctions de R* dans R 


de carré intégrable (telles que | (f (x))? dx < + co) 
J R’ 
est également un espace de Hilbert pour le produit 


scalaire : (| g) = re (9 - g (9 dx. 


Le théorème de projection 


Dans un espace de Hilbert, on définit la notion de pro- 
jection de manière analogue à ce que l'on réalise géomé- 
triquement dans R7. De nombreux problèmes d'analyse 
numérique (problèmes d'optimisation, équations aux 
dérivées partielles, etc.) se résolvent en caractérisant la 
solution comme la projection d'un certain élément d'un 
espace de Hilbert (espace L? ou espace dit de Sobolev) 
sur un sous-ensemble dûment choisi de l'espace. Le 
théorème s'énonce comme suit : 

Théorème : soit H un espace de Hilbert et F une 
partie fermée, convexe et non vide de H. Alors chaque 


ee 
point a de H a une projection et une seule sur F. 

La démonstration du théorème (fig. 11) s'appuie sur 
un résultat bien connu des géomètres sous le nom de 


« lemme de la médiane » : étant donné trois points 
> > > és > > 
a, b, c d'un espace de Hilbert, si m est le milieu de (b, c), 


on a l'égalité 


1—ÊP+lé—-cP=2/2—mP+510—cR 
Soit donc à un point de H. On appelle distance dea à F 
> > 
le nombre d = min] x— 2. On peut trouver une suite 
> 


XEF 
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: — > 
lim | xx — a || 


H— + oo 


— — e 
X1,…, Xn de points F telle que d = 


2 
Il nous faut montrer que la suite des x, converge vers un 


> re e & ‘ 
point x de F; la norme | | étant une application 


> . > 
continue, x sera la projection de a sur F. 
Appliquons le lemme de la médiane 
> 


—+ —+ 
8, Xm €t Xn de F: 


aux trois points 


1, — Se > D 
5 X%m—X = a — 2x 8 + 
— — 
FA 
nu > > 19 | Xm T Xn|f 
[a—xmP—21\a (l. 
ll [} | 2 || 


> + à > 5 
Lorsque m et n 00, |a—x»{? et a — x» |? tendent 
À — — 


9 2 Xm 7 X : s 
vers d?. En outre, F étant convexe 77"? appartient à F, 


2 
Xm T X € ès. = x 
un | > d?. Ainsi donc, le deuxième 
membre de l'égalité a une limite négative. Or cette limite 


ne pouvait être que > 0: il en résulte que 


Là 
et donc ||a — 


s Le pe 
lim | xn — xm | = 0. 


2, M— © 


. . Fr -S . 
Autrement dit, la suite des x, est une suite de Cauchy. 
Comme E est complet, cette suite converge vers un élé- 


œ 
ment « qui appartient encore à F puisque F est fermé 


> > 
dans H. Il est clair que | a — x |? — d?et que cette limite 
est unique (l'unicité est due à la convexité de F). 

Ce résultat, géométriquement évident, acquiert tout 
son intérêt lorsqu'on l'applique à des espaces de Hilbert 
de dimension infinie : en théorie des probabilités par 
exemple, une variable aléatoire X réelle se définit comme 
une application particulière (mesurable) d’un ensemble Q, 
espace des « événements » dans R; X est alors considéré 
comme un élément d'un espace fonctionnel L2 (Q, B, R) 
(B étant une o-a/gèbre définie sur Q). Soit Hx le sous- 
espace de L? (Q, @, R) engendré par la variable X. On 
démontre : 

Hx = {fo X|où f appartient à une certaine classe £ 
de fonctions de R — R}. Hx est un sous-espace (donc 
convexe) et fermé de L2 (Q, B, R). Soit une autre variable 
aléatoire Y. On définit l'espérance conditionnelle de Y 


é Y à —— | 
par X (notée Ë (x) comme la variable aléatoire, projec- 
tion de Y sur Hx. 


Dualité dans les espaces de Hilbert 


La particularité essentielle des espaces de Hilbert est 
qu'il existe un isomorphisme linéaire continu entre H 


ss 
et son dual topologique H’: soit y € H, on lui fait corres- 
pondre, canoniquement, la forme linéaire (continue) 


> > ARE > re " 
U (y) x > (1x); U (y) est un élément du dual H 
pour tout y. En reprenant la notation introduite au chapitre 


> > > > 
précédent, on écrit : {U (y), x> = (y | x). 
U est donc une application de H dans H’ dont on montre 
qu'elle est inversible, linéaire, continue et qu'en outre, 
il s'agit d'une isométrie : c'est-à-dire qu'elle conserve 


" Le RAT ; 
les distances | U (y) |x° = |yæ. On conviendra donc 
d'identifier totalement H et H’ par l'isomorphisme 


{ig.11. 
1g.11 à 
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<« Figure 11 : 

le théorème 

de la projection généralisé 
aux espaces de Hilbert, 
une propriété géométrique 
de l'espace euclidien Rÿ. 


(ce qui, du même coup, revient à identifier le produit 
scalaire | * | -) et l'opération de dualité €, +. Il ressort 
de l'existence d‘un tel isomorphisme qu'un espace de 
Hilbert est un espace réflexif. L'on peut donc en déduire 
que la boule unité de H est faiblement compacte (théo- 
rème de Banach). 


Base hilbertienne d'un espace de Hilbert 


Soit (ia une famille de vecteurs d'un espace de 
Hilbert H. On dira qu'elle constitue un système ortho- 


=> n 
normé sif e|=1  VieJ 
LE « A 
(ei | ei) = 0j j. 
Les vecteurs e; sont donc unitaires et deux à deux ortho- 
gonaux. Une telle famille sera dite base hilbertienne si, 


ES 

de surcroît, le sous-espace engendré par les e; est dense 
EE . 

dans H. Cela signifie que tout vecteur x de H va s'exprimer 


> ee ROME 
comme limite d'une série > xie: où une infinité au plus 
iel 
dénombrable des x; est 0. 
En utilisant le théorème de Zorn, on démontre que tout 
espace de Hilbert admet des bases hilbertiennes, et, qui 
plus est, qu'elles sont toutes équipotentes : c'est-à-dire 


si (eihia et ja sont deux bases hilbertiennes, 
Card | — Card J. 

Cette propriété montre combien la base hilbertienne est 
une généralisation de la base que l'on obtient en dimen- 
sion finie; elle est d’un grand intérêt en analyse, ainsi 
qu'en témoignent les 2 exemples suivants. 


Polynômes de Legendre 
Soit [— 1, + 1] l'ensemble des fonctions réelles 
continues sur [— 1, + 1], et munissons-le du produit 


scalaire élo=[" f(x) : g (x) dx. L'espace [ [—1,+1] 


muni d'un tel produit scalaire n'est pas un espace de 
Hilbert puisqu'il n’est pas complet (c'est un espace dit 
préhilbertien). Néanmoins, il est possible de le « plonger » 
dans un espace plus grand H, son « complété », dont on 
montre en intégration qu'il n'est autre que l'espace 
L2 ([— 1, + 1], dx). 

Appelons polynôme de Legendre de degré n > O0 le 
polynôme : 


lo. dr 


Xn O9 © rai dr 


[C2 — 17]. 
Sn2T 
On vérifie que la suite des polynômes Pr = Xn 


est un système orthonormé de H, c'est-à-dire que 


+1 0 n£m 
[2 Pr C0: Pn GO = |, 2m 

Reste à montrer que c'est une base hilbertienne de H. 
D'abord les P, engendrent tout l'espace des polynômes 
(ils sont indépendants puisque orthogonaux); ensuite 
l'ensemble des polynômes est dense dans [ [— 1, + 1] 
pour la topologie de la convergence uniforme (ce résultat 
est connu sous le nom de théorème de Stone-Weier- 
strass), donc a fortiori pour la topologie préhilbertienne 
qui est moins fine. Enfin [— 1, — 1] est dense dans H 
qui en est le complété. 


Décomposition en série de Fourier 

L'on considère ici des espaces de Hilbert sur le corps 
€. La généralisation se fait sans peine, le produit sca- 
laire (|) étant assujetti à être une forme sesquilinéaire : 

> > > > _ 
elle doit vérifier : B[x,Ay] =2B (x, y) oureC et x 
conjugué de À... 

Soit T l'ensemble des fonctions continues, périodiques 
sur R de période 1. On montre que la famille des fonctions 
{e2irr2}neZ constitue une base hilbertienne de Ÿ. Les 
« composantes » d'une fonction f sur cette base sont 
données par la formule bien connue : 


Cn (f) = Î cf (x) eZinnz dx nez 


et la série 5 Cn (f) e?irrz converge vers f dans H 
nez 


(H étant ici le complété de Ÿ). 
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Les distributions 


Historiquement, les distributions ont été introduites par 
les physiciens dans ce qu'ils appellent le calcul symbolique. 
Il s'agissait de concepts peu rigoureux mais qui possé- 
daient l'avantage de simplifier notablement les calculs : 
ainsi, les physiciens étaient conduits à considérer la dérivée 
de fonctions discontinues auxquelles ils appliquaient les 
règles de calcul usuelles. Ce genre de pratiques était 
assurément fort suspect aux yeux des mathématiciens : 
encore fallait-il expliquer pourquoi elles réussissaient si 
bien aux physiciens. Il revient au mathématicien français 
Laurent Schwartz d'avoir élaboré une théorie mathéma- 
tique nouvelle qui a permis de résoudre cette contra- 
diction (1947) : en définissant une distribution comme 
un élément du dual d'un espace de fonctions particulier, 
il a donné la justification théorique du langage des physi- 
ciens. Nous présentons donc les distributions en montrant 
quels phénomènes physiques elles permettent de décrire. 


Définition d'une distribution 


Soit D l'espace vectoriel des fonctions ©: R? +R 
indéfiniment dérivables et à support compact (chaque 
fonction © est nulle en dehors d’un compact K; que 
l'on appelle support de ©). Par exemple, la fonction 
6:R = R définie par: 


[9 silx| > 1 


6 (x) — 


el—x? six] < 1 


est un élément de D (pour n = 1) : il faut vérifier que 6 
est dérivable partout (surtout en + 1 et — 1) et qu'en 
ces deux points toutes ses dérivées sont nulles. L'espace D 
est un espace de fonctions que l'on peut munir d'une topo- 
logie adaptée à sa structure propre : nous définissons 
cette topologie en caractérisant la notion de convergence 
(cela nous suffira amplement ici ; mais on montre que cette 
topologie est semi-normable) : on dira qu'une suite 
9; de D converge vers une fonction © de D si: 

— les supports des o; sont contenus dans un même 
ensemble borné, indépendant de /; 

— les dérivées de tout ordre m des o; convergent 
uniformément vers les dérivées correspondantes de ©. 

On appelle distribution T une forme linéaire continue 

sur l'espace vectoriel topologique D. Autrement dit, 
ee est un élément du dual topologique D’ 
de Ÿ. 


Une distribution possède donc les propriétés suivantes: 


ÉT, 1 + pa) = LT, o1) + KT, 92} 

TA D = À1<T, op) 
si o; converge vers © au sens de la topologie de D, 
les nombres €T, »;> convergent vers <T, 6). 

Exemples 
(a) Soit / une fonction de R? +R, intégrable 

pour la mesure de Lebesgue; elle définit une distribution 
T; par: 


ÉTr. ed = ” FX) © (X) GX dXn. 


Cette intégrale a bien un sens puisque la fonction © est 
nulle en dehors d'un certain compact K:. Il s'agit bien 
d'une forme linéaire dont il nous reste à établir la conti- 
nuité : soit o; une suite de fonctions convergentes vers ® 
dans D : soit K le compact contenant tous les supports des 


3 Tr — 5) — KTr P}| = 
| | Fe  * 9 (x) * dx, din — 


| À (À : o (X) dx, … dXn 


Ÿ 


< iL If CO] dx, … dx). Mex 


o D — @ 


Comme la convergence des +; est uniforme, 
Max |o (x) — 9; (x)| + 0 
xeK 


et ainsi £Tz, 9) = <Tz, ©). On remarque que, dans ce 
cas, T; est la mesure de densité f. Nous conviendrons 
désormais d'identifier la distribution T; et la fonction f : 
ainsi, nous dirons qu'une distribution est une fonction f 
si la valeur qu'elle prend pour toute fonction © de D est 
donnée par 


pr 


(Te) |, 09 8 09 dix … dx. 


(b) Plus généralement, notons D un opérateur de 
dérivation partielle d'ordre quelconque en Xx1,.…, Xn : 
la forme linéaire 


ÉT.eÿ = 1 F C0 De (x) dx, dXn Tr, Doÿ 


est également une distribution que l'on note DT;. Nous 
justifierons cette notation dans le paragraphe suivant. 
(c) Une distribution bien connue des physiciens 


est la distribution de Dirac, définie par <à, 9ÿ = © (Ô). 

En un point a de 7, la distribution de Dirac à () est 

définie par (3 (8), 9) = © (8). 

Distributions mathématiques 

et distributions des charges en physique 
Considérons un solide à de volume V dans R? et de 

densité f ©. f 69) représente la masse d'un élément de 


volume dV contenant le point x. Appelons T; la distribu- 
tion définie par la fonction f [cf. exemple (a)]. La masse 
totale du solide S est donnée par l'intégrale : 


n 


100 dxx, ee din = Tr, 1. 


JVCR? 
De même, le moment d'inertie par rapport à l'origine 


est égal à: ll, # GO X |P dx, … dx, soit (Tr, | |2D où | 


désigne la fonction x++ || x |?. Ainsi donc, en physique eten 
mécanique, on est conduit à calculer de nombreuses 
expressions de la forme &T, #ÿ où T représente une « dis- 
tribution » de masses. Mais c'est en électrostatique, en 
magnétisme et en mécanique quantique que l'on est 
conduit à faire un usage plus spécifique des distributions 
(dans l'exemple pris à l'instant, la notion de « mesure » 
suffitl). Considérons par exemple la distribution de 
charges électriques définie par un doublet de moment 
électrique + 1 placé en O sur la droite R. Ce doublet est 


AA 
« la limite » du système T- de deux charges (+ = et— 


placées aux points O et &. 
0 è 
f 1 
Ha = 
Te définit une distribution dont la Valeur en une fonction ® 
1 1 
de D est donnée par Te, ®ÿ = —® (€) - (o (0)). 


Lorsque € — 0, &T:, ©) tend vers #’ (0). Nous sommes 
ainsi amenés naturellement à définir le doublet par la 
distribution £T, > = »’ (0). 


Dérivation des distributions 
_. me O4 RP 
Cherchons à définir la dérivée 3 une distribution T 
1 


sur R? par rapport à la variable x1, de telle sorte que, lors- 
que T est une fonction f continue et à dérivées partielles 


, : of 
premières continues, on retrouve A dans le sens usuel du 
É 


calcul différentiel classique. Soit donc f une telle fonction: 


of of 
Ge +) = Î CE dx1, ir dXn = 


R" 0x1 
té f+co Cf 
se dx, 4x — * © dx: 
Ja J a 1e ide 
' SU : f+o Cf 
en intégrant par parties l'intégrale simple | — * © dx1, 
ss J- 0X1 


e Fr ê 
on trouve [é: el 7 | Fire dx1. La fonction ® 
= J - o Cx1 
étant à support compact, le terme [r- e|” disparaît. 
— © 
à à ; of Ô 
Finalement, on obtient l'égalité De +) = —(s À) 
OX] CX1 


Cette égalité a été obtenue dans le cas où f était diffé- 
rentiable. Nous sommes conduits à la prendre comme 


Ass LE Q 
définition de la dérivée _ en posant : 
1 


êT E êo 
Le +) pit ( _ 


je nd LOI 
On vérifie que cette égalité définit bien Er comme une 
1 


distribution : il s’agit évidemment d'une forme linéaire 
sur D dont on montre qu'elle est continue pour la topologie 
définie sur D. 

Plus généralement, on définira les dérivées de tous 
ordres d'une distribution T par la formule : 


CDPT, 8) = (— 1)Iz1 €T, D?e) 


où p = (p1, …, Pr) est un système de n nombres entiers 

avec |p| = p1 + p2 + … + pr, et D? représente la dériva- 
j 2 \?P1/ G\P2 [a \rn 

tion _ (5 a (x) : 
(& ôX2) ©Xn) 

L'intérêt de cette définition est tout à fait primordial : 
dans le cas où la distribution T est une fonction intégrable 
(pas forcément continue), il est possible de définir les 
dérivées de tous ordres de la fonction f mais il ne s'agit 
pas en général de fonctions, il s'agit de distributions. 
Ainsi se trouvent justifiées de manière rigoureuse les 
pratiques des physiciens en calcul symbolique lorsque 
ceux-ci « dérivaient » des fonctions discontinues. 

Exemple : la fonction d'Heaviside (fig. 12). 


{ 0 x < 0 
\T x>=0 
Cette fonction est utilisée en électricité sous le nom 


« échelon unité ». Elle n'est bien sûr pas continue en O. 
Calculons la dérivée DY : 


(DY, pÿ = —«Y: Dp} = 
LT a 09 = — | +" 09 dx = 


V 


Soit ylafonction deR — R définie pary (x) = 


J - 


— [e of * = 9 (0) = <8, p} 


on a donc DY = 5.5 est la distribution de Dirac [cf. 
exemple (c)] que les électriciens appellent « impulsion 
unité ». La dérivée seconde D?y est donnée par 


<D2y, 6) = <D8, e» = — €8, D? = — 9 (0) 


D2y est donc la distribution associée au doublet de 
moment — 1 en 0. 
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À Figure 12 : 
graphe de la 
fonction d'Heaviside. 
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CALCUL TENSORIEL 


Le calcul tensoriel provient de problèmes posés par 
la mécanique classique. C'est à Curbastro Gregorio Ricci 
(1853-1925) et à Tullio Levi-Civita (1873-1941) que 
l'on doit le premier exposé relatif à cet outil mathéma- 
tique abstrait, que, d'un point de vue mathématique, on 
doit considérer comme une extension de la théorie des 
espaces vectoriels. 

La théorie de la relativité générale, qui a vu le jour grâce 
à l'existence du calcul, a permis, par ricochet, l'extension 
de ce domaine au travers des problèmes de géométrie 
différentielle particulièrement étudiés par Élie Cartan 
(1869-1951). 

La présentation mathématique du calcul tensoriel est 
en fait celle de l'algèbre multilinéaire ; toutefois, le produit 
tensoriel de deux espaces vectoriels E et F peut être pré- 
senté comme solution — unique à un isomorphisme près — 
d'un problème dit problème universel : E @ F et l'applica- 
tion f, bilinéaire, dite produit tensoriel, Vérifient la pro- 
priété : quels que soient l'espace vectoriel G et l'application 
bilinéaire g:E x F — G,il existe /€E£ (E @ F, G) telle 
que g=/of. 

On dit parfois encore que l'espace vectoriel E @ F est 
l'espace vectoriel des combinaisons linéaires formelles 
des éléments de E x F; cette application sera sans doute 
plus clarifiée par la présentation adoptée ci-dessous : 


3 


EXF = +56 


NA 


Produit tensoriel 


Considérons un espace vectoriel E, de dimension finie n, 
sur un corps K. On sait que l’ensemble des applications 
linéaires de E dans K forme, pour les opérations usuelles 
d'addition et de produit par un scalaire, un espace vec- 
toriel, appelé dual de E, noté E*. De plus, si (e;);-1,..,n 
est une base de E, alors les applications ei définies pour 
tout / = 1,2,..,n par: 
jets] 0 sii£)j 
PET ds 
forment une base de E*. 

Considérons alors fe E* et g € E*, deux formes linéaires. 
L'application t:E x E — K, définie par 


t (x.y) = F (x) : g (y), 


est bilinéaire et représente une forme d'association de 
f et g par l'intermédiaire des valeurs de chacune prises 
séparément. Cette forme bilinéaire sur E est appelée 
produit tensoriel de f et g; on la note f @ g. Plus géné- 
ralement encore, si f1, f2, …, fr Sont p formes linéaires 
sur E, l'application T : E? = K définie par : 


…, Xp) = F1 (x1) * 2 (X2) …, fn (Xp) 


est p-linéaire et « associe » 1, …, fn à travers les valeurs 
de chacune; on l'appelle produit tensoriel de #1, f2, …, fp, 
noté fi (a) fa (a) fa … (2) fo. 

En particulier, les éléments (e’);,_: , de la base de E* 
combinés deux à deux par le produit tensoriel définissent 
n? formes bilinéaires (e? @ ef);-1, 

j=1, 
telles que eî © ef (x, y) = x:y;, en désignant par x; la 
i-ième coordonnée de x et par y; la j-ième de y dans la 
base choisie de E. L'espace vectoriel engendré (c'est-à- 
dire reconstitué par les opérations d’addition et de produit 
par un scalaire) par ces formes bilinéaires est désigné par 
le nom de produit tensoriel de E* par lui-même, ce qu'on 
note E* @ E*, ou encore @ E. 
2 


T (x x2, 


in 


Cet espace n'est pas vraiment inconnu; c'est en réalité 
l'ensemble des formes bilinéaires sur E. En effet, soit B 
une telle forme, alors, 


n 
si X = b xiei ety = 


i=1 


n 
D ve 
j=1 
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sont deux vecteurs quelconques de E,ona: 


n 


n 
B(Xy)= > D xy:B (ere) 
ile 
soit, en posant Ài,;, = B (e:, e;), on voit que: 
n 


D D set ® ei (x y) 


i=1j=l 
donc que B € @ E. Tout élément de E* @ E* étant une 
2 


B (x y) 


forme bilinéaire, l'ensemble de celles-ci est donc exacte- 
ment E* @ E*. 
On définit donc de même l'ensemble 
E* QE" @ 4 © E" = QE; 
A  — ?p 
p fois 


qui n'est autre que l’espace vectoriel des formes p-linéaires 
sur E: il est engendré par les applications de E? dans K, 
ei Q e2 @ … © ei où /1, 2, …, În désignent p valeurs, 
non nécessairement distinctes, des nombres entiers 
1,2,..,n. On peut montrer que ces applications sont 
linéairement indépendantes pour tous les choix différents 
— il y en a n? — des indices /1, /2, …, (y; par conséquent, 
dim @ E = n?. 
? à 

Le produit tensoriel ainsi défini tant pour des formes 
linéaires sur un même espace que pour des espaces tous 
égaux entre eux peut être généralisé à des espaces diffé- 
rents, mais sur un même corps de base. Prenant deux 
espaces vectoriels E1 et E2, de dimensions n1 et n2, sur un 
corps K et deux formes linéaires f1 € E1*, fo € Es* on défi- 
nit le produit tensoriel f1 @ f2 par : 


fi @Qfe (x1,Xx2) = f1(x1) X fox), VX EE et Vx2€ Eo 


Ce produit tensoriel est une application bilinéaire de 
E x F dans K. En appliquant cette opération aux élé- 
ments d'une base (eï),., ., de E*1 et d'une base 
(ef);21, 2 de E‘2, on définit »1 x n2 formes bilinéaires 
(ei @Q €);-1,.,m qui engendrent un espace vectoriel, 
f=1,...,n2 

dit produit tensoriel de E* et F*, noté E* @ F*, qui n'est 
autre que l'ensemble des formes bilinéaires sur E X F (ce 
que l'on montre par un raisonnement analogue à celui 
fait pour F = E). 

L'opération produit tensoriel apparaît donc comme un 
moyen de représentation de la multilinéarité par des outils 
linéaires, où en sens inverse comme une «recomposition », 
par de simples formes linéaires, de formes multilinéaires. 
Elle permet de dégager un cadre général pour l'algèbre 
multilinéaire. 

On peut noter dès maintenant que la possibilité d'iden- 
tifier à un isomorphisme près le dual de E* (soit le 
bidual E**) à l’ensemble E permet de construire le produit 


P 
tensoriel E © E © … @ E, noté aussi @ E*, ainsi que 
3 EE  — e 
p fois 

le produit tensoriel x1 @ x2 © … © x» qui est une 
application p-linéaire de E*? dans K définie par : 
Xx1 © x2 © … © Xp (F1, F2, …, fp) = 

fi (x) X fe Ce) X 
quelles que soient f1 € E*,f2€ E*, …, fn € E*. 


ton fp (Xp) 


Plus généralement encore, on peut construire le produit 
tensoriel d'éléments de E et d'éléments de E*. Soit par 
exemple deux formes linéaires f€ E* et ge E*, et trois 
éléments X1, X2, X3 de E (donc formes linéaires sur E*); 
le produit tensoriel f © g @ X1 © X2 © X3 est une for- 
me 5-linéaire : 

C4, X2, A1, ha, ha) — 
f(x) x g (x) X h1 (X1) X ha (X2) X hs (X3) 


définie sur E2 x E*3. On peut donc former les n° applica- 
tions 


en © e2 © es © eu © es de E2 x E*3 dans K 


où /1, 2, ls, la, Îs désignent cinq valeurs, non nécessaire- 
ment distinctes, des nombres 1, 2, …, n. On note 


E Q E © E* © E* @ E* 


l'espace vectoriel engendré par ces n5 formes linéaires. 


C'est par l'idée du produit tensoriel d'espaces que l'on 
peut maintenant dégager la notion de tenseur et une loi 
de composition, dite produit tensoriel, entre ces êtres 
mathématiques abstraits. 


Tenseurs 


Un élément de l'espace dual E* est dit tenseur 1-cova- 
riant (ou tenseur covariant d'ordre 1). Une forme 
p-linéaire sur E est dite tenseur p-covariant (ou tenseur 
covariant d'ordre p). 

La dénomination choisie s'explique ainsi : si u est un 

n 


élément de E*, on peut écrire u — pi u;  e? dans la base 


(eï);-1,..,n duale de celle (e;);-1,.,1 Choisie pour E; 
avec u; = u (ei); si (£i):-1,.…,n désigne une autre base 
de E, liée à la première par les formules de passage 


n 
= > ae, on peut écrire dans la base (2ï);:-1,..,n 


F=A 
n 
> visi 
i=1 


duale de (s);-1,.,n une décomposition u — 
où v; = u (s). Alors v: s'écrit aussi : 


n n 
Vi=u (> 7 = ei xju;. Les formules de passage 


j=1 j=i 


pour les coordonnées (ou composantes) des éléments de 
E* et pour une base de E sont donc les mêmes : on dit 
pour cela que l'on a covariance. 

Un élément de l'espace E (pouvant être, puisqu'on 
suppose E de dimension finie, considéré comme une forme 
linéaire sur E*) est dit tenseur 1-contravariant (ou ten- 
seur contravariant d'ordre 1). Une forme g-linéaire définie 
sur E*, c'est-à-dire une application de (E*)2 dans le 
corps de base K, linéaire par rapport à chaque argument, 
est appelée tenseur qg-contravariant (ou tenseur contra- 
variant d'ordre q). En effet, il y a variation opposée des 
formules de passage pour les coordonnées d'un vecteur 
rapporté à une base et les vecteurs de cette base puisque, 

n 


sia= D age, alors (xihi-sn 6t (Yf}yesn COOT- 
Ja 
données de x respectivement selon les bases (@i):-:1,...,» 
n 
et (s);-1, …n sont liées par:xi= D api. 
j=1 


L'algèbre tensorielle fait, on le voit, un usage intensif 
d'indices. Cela ne saurait surprendre celui qui reconnaît 
dans cette partie des mathématiques une présentation 
des phénomènes de multilinéarité. Toutefois, l'usage 
en devient vite lourd et la répétition des symboles de som- 
mations concernant les divers indices en jeu apparaît 
dès lors comme un fardeau d'écriture (et de lecture !) bien 
pesant. 

Un jeu de conventions d'écritures permet de tout sim- 
plifier. Tout d'abord, on affecte à tout indice qui a une 
signification de covariance ou de contravariance une 
position en rapport : les indices de covariance seront 
supérieurs (sans risque de confusion avec un exposant) 
tandis que les indices de contravariance seront placés 
en dessous. Ainsi, on note 

i=n 
X= > xiet 
i=1 


sixeE* 


n 
alors que y = 2 vie: SiyeE; 
i=i 
n 


par suite, on notera €; — L: ile; les formules de chan- 
Eu 


gement de base dans E. 

Dans ces formules de sommation, on remarque que 
l'indice par rapport auquel s'effectue la somme se trouve 
toujours une fois en position basse et une fois en position 
haute : ceci n’est rien d'autre que la transcription de l'idée 
de dualité (ou de correspondance par dualité). Cette 
constatation amène à poser la convention dite convention 
d'Einstein : 


Dans tout monôme où figure un même indice répété 
une fois comme indice covariant (position supérieure) 
et une fois comme indice contravariant (position infé- 
rieure), on considère qu'il s'agit en fait de la somme des 
monômes obtenus pour les diverses valeurs de cet indice 
(on sous-entend donc la sommation). Par conséquent, 
avec cette convention, on écrira x — x;eî au lieu de 

n n 
k= > xet, ou bien &; = we; au lieu de #; — ki CAT 
i=1 j=1 
ou bien encore : x*,! = api: ak - b;l-: c,} au lieu de l'ex- 
n m q 
pression usuelle xp! — 5 ps ani 
i=1j-i h=1 


aE + bite cPy. 


Deux remarques s'imposent au sujet de l'utilisation de 
cette règle. Tout d’abord, le domaine des valeurs d'un 
indice de sommation n'est plus précisé, et il importe donc 
bien qu'il n'y ait aucune ambiguïté, ce qui demande une 
pratique du problème d'autant plus grande que le nombre 
des indices en jeu est élevé. En second lieu, il est clair que 
la position d'un indice est primordiale, car la convention 
d'Einstein ne peut s'appliquer que si l'on a la possibilité 
d'associer covariance et contravariance. Par conséquent, 
chaque indice doit être placé en conformité avec sa signi- 
fication : covariant ou contravariant. On est donc tenté 
de voir une difficulté supplémentaire dans l'application 
de ce mécanisme; ce qui, en réalité est inexact, car l'utili- 
sation simultanée d'indices, toujours délicate, demande 
en outre la connaissance de leurs domaines de valeurs et 
de leur signification. 

Il a été montré que l'ensemble des tenseurs p-cova- 
riants muni des deux opérations usuelles — addition 
et produit par un scalaire — avait une structure d'espace 
vectoriel; on le désigne par © E. Il en est de même pour 

p 


q 
l'ensemble destenseurs g-contravariants, @ E. Une base de 
l'espace © E est obtenue par les éléments 


p : ; ; 
ei © e2 © … © er, 


produit tensoriel de p vecteurs de la base duale de celle 


q 

choisie dans E, et une base de l'espace @ E est obtenue 
par les éléments e;1 @ e;2 © … @ 659, produit tensoriel 
de q vecteurs de la base de E (identifiée à la base du 


q 
bidual E**). Pour tout élément de @ E ou de @ E, il existe 
» 

donc un système de n? scalaires dans le premier cas, de n4 
dans le second, réalisant la décomposition relativement à la 
base citée : ce sont — conformément à la terminologie 
usuelle de l'algèbre linéaire — les coordonnées du tenseur 
relativement à la base donnée. 

Ainsi, soit T un tenseur 3-covariant, TE @ E; ce ten- 

3 


seur est une application de E° dans K, et pour tout triplet 
(X Y,2)EES où x = xie;, y — yie;, z = zFez 
(convention d'Einstein), on a: 


T (x y,z) =T (xer, yie;, z'ex) — xiyizËT (e;, e;, ex) 
en développant selon la trilinéarité; en posant 
T (ei, e;, ex) = tjr, 
on obtient T (x, y, z) = ti;zxiyizE, ce qui donne 
T'= tijre° (a) ei (2) e* 


par définition des éléments ei @ ei @ eë. 
De la même façon, pour un tenseur 4-contravariant 


4 
Ue@ E,onobtientU = uüile; © e; @ ex @ er en posant 
uükl — U (ei, ei, eë, el). 

L'obtention, et donc l’utilisation, des coordonnées d'un 
tenseur est identique à celle de la matrice d'une appli- 
cation linéaire. On verra plus loin qu'il ne s’agit pas d'une 
coïncidence. 

Les tenseurs mixtes se définissent selon le même prin- 
cipe. Par exemple, un tenseur 2-covariant, 1-contrava- 
riant, 1-covariant est une forme 4-linéaire sur l'espace 
E2 x E* x E; l'ensemble de ces tenseurs forme un espace 
vectoriel qui est engendré par les éléments 


ei @ ei @ er @ €’, 


les indices /, j, k et / prenant toutes les valeurs entières de 
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1 à n = dimE. Si T est un tenseur de ce type, on a : 
TX y. F2) =T (xe:, yie;, Fref, zler) 
T = Th et © ei @ er © e! 
Tij# = T (e, ej, e*, e). 
Les n scalaires T;;; sont les coordonnées du tenseur 
mixteT. 

Pour tout tenseur, covariant, contravariant ou mixte, 
les coordonnées sont liées au choix de la base choisie pour 
l'espace E, puisque alors la base duale (celle de E*) est 
définie, et donc celle de tout produit tensoriel d'espaces. 
Dans tout problème, le choix de la base peut nécessiter une 
modification ultérieure et ne pas être irrévocable. Il est 
donc nécessaire de disposer — en algèbre tensorielle 
comme en algèbre linéaire — de formules établissant l'effet 
d'un changement de base sur un tenseur, donc sur ses 
coordonnées. Dans le cas d'un tenseur T covariant 
d'ordre 3, si l’on passe de la base (e;); =; à la base 
(si): = 1,..,n Selon s; = aÂe; (convention d'Einstein), on a: 


d'où 
avec 


T = tr ei @ ei © eF dans la première base, et 
T = vi si © si @ <Ë dans la seconde; donc 
Vie = T (si, 2, ex) = T (ah @, a; em, «x er) 
soit 
vis = di am; ax T (er, Em, Er) = ah a; ax timr. 
On établirait aussi bien pour un tenseur 4-contrava- 
riant U ayant les coordonnées u##l dans la base (e;) et 
wüEÆl dans la base (si) : 
wii kl = Gim Bip x, Bls umprs 


où Bim représente l'élément situé à la /-ième ligne et 
m-ième colonne dans la matrice inverse de celle formée 
par les œi. 

Pour un tenseur mixte T, 1-covariant, 1-contravariant, 
1-covariant de coordonnées #/} et vx, on obtiendrait la 
formule : 


Vlr = di Qi ex tr. 


En général, on voit que les coefficients x interviennent 
pour chaque covariance et les coefficients 5 pour chaque 
contravariance. Bien entendu, on pourrait écrire une for- 
mule générale de changement de base, mais son intérêt 
serait très limité en raison de sa complexité d'écriture, ce 
qu'il est aisé d'imaginer. 

Il est à noter que ces expressions réalisent une condi- 
tion nécessaire et suffisante pour qu'un système de sca- 
laires puisse être considéré comme les coordonnées d'un 
tenseur de type défini. De cette règle, d'ailleurs, dérivent 
encore trois autres critères de reconnaissance d'un tenseur 
par ses coordonnées. 


Quelques tenseurs particuliers 


A toute application linéaire Le £ (E), on associe un 
tenseur mixte T du second ordre 1-contravariant, 1-cova- 
riant en posant : 

T:(F,x) =F(L(x))oùFeE*etxeE. 
Les coordonnées de ce tenseur sont données par: 
ty =T (ei,e;) = ef (L (e;)): 

or L (e;) est un élément de E dont les coordonnées — selon 
la base (e:);=:,..,, — forment la /-ième colonne de la 
matrice de L dans la base choisie, et donc sa j-ième com- 
posante — soit et (L (e;)) — n'est autre que l'élément m; 
situé à la /-ième ligne et /-ième colonne de cette matrice. 
On en déduit donc l'existence d'une bijection entre l'en- 
semble £ (E) des applications linéaires de E dans lui- 
même et l'ensemble E* @ E des tenseurs mixtes 1-contra- 
variant, 1-covariant, puisque les formules usuelles de 
changement de base montrent que les éléments d'une 
matrice peuvent être considérés comme les coordonnées 
d'un tel tenseur mixte. 

Si L est une application linéaire de E* dans E, on peut 
lui associer un tenseur 2-covariant T € E* @ E* par: 


T:(F,G)—F(L(G)) oùFeE* etGeE*. 
Les coordonnées de ce tenseur sont : 
ti = T (ef, ei) = ei (L (ei)); 
c'est-à-dire que, comme précédemment, les coordonnées 
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de T sont les éléments de la matrice de l'application L. 
On met donc ainsi en évidence une bijection entre l'en- 
semble © E (soit E* @ E*) et l'ensemble £ (E*, E). 

2 


On peut noter, pour préciser ces liens entre ensembles 
de tenseurs d'ordre 2 et ensembles d'applications linéaires 
(ou aussi ensemble des matrices carrées d'ordre n), que 
ce sont des bijections linéaires, c’est-à-dire des isomor- 
phismes. 

Le tenseur — dit éenseur de Kronecker — mixte du 
second ordre 1-covariant, 1-contravariant défini par ses 
composantes : 

dù = (o) sil £ j, di; — 1 
correspond — par l'isomorphisme vu plus haut — à l'ap- 
plication identité de l'espace E. On sait que la matrice 
de cette application est invariante par changement de la 
base de E; cette propriété reste vraie pour les composantes 
du tenseur de Kronecker. En effet, si les coordonnées dans 
une autre base sont t'; ,on peut écrire : tè; — à am; Dm, 
ce qui devient, après avoir simplifié les termes nuls de la 
somme sous-entendue : ti; — Bi; xl;, soit ti; — di; puis- 
que les coefficients x et 8 sont ceux de deux matrices 
inverses r'une de l'autre. 

Parmi les tenseurs du second ordre 2-covariants ou 
2-contravariants, on distingue deux cas particuliers : les 
tenseurs symétriques et les tenseurs antisymétriques. Dans 
le premier cas, il s'agit de tenseurs T tels que 


TXY)=T (MX) 


pour tous (X,Y)£=E x E pour le cas covariant, pour 
tous (X, Y)EeE* x E* pour la contravariance; dans le 
second, il s'agit de tenseurs U tels que 


U (X, Y) = —U (Y, X). 


Il est clair qu'on ne peut étendre ces notions aux tenseurs 
mixtes. Un tenseur 2-covariant sera donc symétrique si ses 
coordonnées vérifient &;; = tx pour tout couple (,j); 
pour un tenseur 2-contravariant symétrique, on aura 
ti = ti, Un tenseur 2-covariant sera antisymétrique si ses 
coordonnées vérifient {3 = — t; pour tout couple (/,j); 
pour un tenseur 2-contravariant antisymétrique, on a 
ti = — ti, 

Tout tenseur 2-covariant (de même que tout tenseur 
2-contravariant) peut s’écrire comme somme d'un ten- 
seur symétrique et d’un tenseur antisymétrique de mêmes 
espèces, puisque, si T est de coordonnées t;;, alors le ten- 


sii= j, 


1 à 

seur de composante 3 (ti; + ti) est symétrique, le tenseur 
1 : De 

de composantes 3 (tj — ti) est antisymétrique, et de plus: 


1 1 
tj = 5 Ci 6) + 3 Gi — ti). 


Mais bien évidemment, d'après les isomorphismes vus 
plus haut, les propriétés des tenseurs d'ordre 2 se recou- 
pent avec celles des applications linéaires. 

Un tenseur p-covariant est dit alterné s'il s’annule 
lorsqu'on l’applique à p vecteurs dont deux sont égaux. 
On voit que, sip — 2, un tel tenseur est antisymétrique. On 
définit de même les tenseurs g-contravariants alternés. 
Il est alors facile de montrer qu'un tenseur est alterné dès 
que, dans une base fixée, ses coordonnées sont des fonc- 
tions alternées des indices. Par conséquent, un tenseur 
alterné d'ordre p > dim E = nest nul, puisque, pour toute 
coordonnée ti:5 … /», les indices /1, 2, …, , prennent leurs 
valeurs parmi 1, 2, …, n, donc deux d'entre eux au moins 
sont égaux. 

Lorsque l'espace vectoriel E est un espace euclidien 
(c'est-à-dire muni d'une forme bilinéaire symétrique dont 
la forme quadratique associée est définie positive), 
il est possible d'associer les tenseurs de même ordre des 
types définis plus haut (on parle de tenseurs affines) : 
on parle alors de tenseur euclidien. Si l'on effectue le 
produit scalaire de deux éléments X et Y de E, on écrit 


EX, Y> = <xier, vies) = xiyi er, ej) 
(convention d'Einstein) ; soit {X, Y> = gixiyf, si l'on pose 
gi = er, e;> (les signes € > désignent ici le résultat 
de la forme bilinéaire symétrique donnant à E son carac- 


tère euclidien). En tenant compte de ce que le produit 
scalaire est invariant par changement de base, et qu'il est 


commutatif (car la forme bilinéaire est supposée symé- 
trique), les scalaires g:; sont les composantes (covariantes) 
d'un tenseur euclidien, que l'on appelle le tenseur fonda- 
mental de l'espace E. 

Ceci n'est valable que parce que tout espace euclidien 
est isomorphe à son dual — donc peut lui être identifié — 
par l'intermédiaire de la correspondance qui, àtoutxEE, 
associe la forme linéaire définie par y — x, y» pour tout 
y € E. Les propriétés de la forme bilinéaire fondamentale 
(ici désignée par < ÿ) font de cette application un isomor- 
phisme d'espaces vectoriels qui ne dépend aucunement 
d'une quelconque base de E : c'est donc bien un isomor- 
phisme canonique qui permet de passer de E à E* ou, si 
l'on préfère, de remplacer, lorsque besoin est, un élément 
xeË par un élément de E* sans qu'aucune propriété 
linéaire en soit affectée. 

Ainsi, un vecteur (contravariant) x € E se décompose 
sur une base (@);-1,...,n Selon x = xie;, les scalaires x 
étant appelés composantes contravariantes de x. L'élé- 
ment f,e E* associé à x par l'isomorphisme précédent 
admet pour composantes, notées (f-):, dans la base duale 
(Bihinn un (fi = <x, @) = gx. Puisque l'on peut 
identifier x et fr, il est donc légitime de donner à ces sca- 
laires, qui sont les composantes covariantes d'un élément 
de E*, le nom de composantes covariantes de x; on les 
note donc x:, et elles vérifient x; = gi;xi (sommation sous- 
entendue). 

Par conséquent, ainsi que le montre la construction des 
tenseurs affines (éléments d'un produit tensoriel d'es- 
paces E ou E*), de tels tenseurs, d'un même ordre, défi- 
nissent un seul et même tenseur dit tenseur euclidien dont 
les différentes composantes covariantes, contravariantes 
ou mixtes se déduisent entre elles par produit (et somma- 
tion sous-entendue) par g:; ou gf (éléments de la matrice 
inverse) : ces opérations étant au plus répétées N fois, 
si N désigne l'ordre du tenseur (c'est-à-dire la somme du 
degré de covariance et du degré de contravariance). 


Opérations sur les tenseurs 


C'est par les opérations de calcul tensoriel que l'on 
va dégager la puissance de cet outil très abstrait; les 
structures obtenues montrent sa valeur par rapport à ce 
qui a été obtenu dans le cadre linéaire. 

Tout d'abord, concernant les tenseurs d'un même type 
(c'est-à-dire de même degré de covariance et contra- 
variance), on construit la structure usuelle d'espace vec- 
toriel par l'intermédiaire d’une loi additive et d'un produit 
par un scalaire. L'addition d'un tenseur T et d'un tenseur T 
de même espèce est donc définie par un tenseur T + 1 
tel que : 


(T+ T7) CU X2, XX) = 
T (XXe, Xx) + T' (Xz X2, …, XX) 


ce qui est possible puisque T et T’ opèrent sur les mêmes 
espaces. Il est clair que cette addition donne à l'ensemble 
des tenseurs d’un même type une structure de groupe 
commutatif. Le produit d'un tenseur T par un scalaire « 
est un tenseur du même type, aT, tel que : 


(aT) (X1, Xe, …, Xx) = &° T (X1 X2, …, XX). 


Cette loi externe complète alors la structure linéaire de 
l'ensemble des tenseurs d'une même espèce : p-cova- 
riant ou g-contravariant, ou bien mixte m-covariant et 
n-contravariant. 

Mais, dépassant cette structure, on dispose d'une opé- 
ration supplémentaire, le produit tensoriel, qui va per- 
mettre de définir sur de vastes ensembles de tenseurs un 
cadre d'algèbre. 


SiTiestun tenseur (;) —p-covariant, g-contravariant — 


et Te un tenseur d'espèce He on définit le produit tensoriel 


T1 @ Te comme un tenseur d'espèce (2 fs “). tel que : 
\ 


Ti © Te Xe Ko is 25 Var he Nm Ve Vi) = 
HE Xe car Nr Vire Va) © Te Ones mr Vire Va): 


Le premier tenseur est en fait une forme (p — g)-linéaire, 
le second une forme (m + n)-linéaire; leur produit ten- 
soriel est une forme (p + m+ g+ n)-linéaire. Il ne 
s'agit donc pas d'une loi de composition interne sur l'en- 
semble des tenseurs d'un type donné. 


Les coordonnées du produit tensoriel s’obtiennent par 
produit des coordonnées concernées des tenseurs dont 


on fait le produit. Ainsi, si T1 est un tenseur (1) et T2 un 


tenseur (2). le produit tensoriel T1 @ T2 est d'espèce (;) 
et ses coordonnées sont 


T1 @ T2 (e, 65, ex, eh, el, er, es, et) = 
Ti (ei, e, ex, e*, el) x Ta (er, es, et) 


donc (T1 © T2)i,5,8, hrs = (Ti)i,5,8, br * (Ta)r,sif. 


Les principales propriétés du produit tensoriel sont 
données par : 


U @ (Ti + Te) = U @ T1 + U @ T2; 
(T1 + Te) © U = T1 @ U + T2 © U (distributivité) 
T® (à: U) = (AT) @ U= à: (T @ U). 
(T1 ® Te) @ Ts = T1 © (T2 ® Ts) (associativité). 


Par conséquent, l'application : (T1, T2) + T1 © T2 est 
bilinéaire. On peut noter que si T1 et T2 sont deux tenseurs, 
leur produit de composition au sens des applications 
— lorsqu'il a un sens — n'est pas en général égal à leur 
produit tensoriel : T10 T2%# T1 @ T2. 

Le produit d'un tenseur p-covariant par un tenseur 
m-covariant est un tenseur (p + m)-covariant. Il vient 
donc à l'idée d'associer les espaces © E de façon à regrou- 

D 


per tous les tenseurs covariants. Pour cela, on définit 


l'ensemble Q E comme somme directe des espaces vec- 
o 


toriels © E, donc @Q E = ES (e :) avec : 
P o 


p=0 P 
QE=E, @QE=E*, @QE=E* @ E*, etc. 
o 1 


2 
Tout élément de @ E, dit tenseur affine covariant, sera 
o 
donc une somme de tenseurs p-covariants (p € N)'dont 
seul un nombre fini est non nul. || devient alors possible de 
définir une addition et un produit tensoriel à l'intérieur 


de ® E. Les différentes propriétés que l'on établit alors 
o 
aisément munissent cet ensemble d'une structure d'an- 
neau qui, combinée à celle d'espace vectoriel, en fait 
l'algèbre des tenseurs covariants sur E. 
Cette construction est évidemment réalisable pour les 


tenseurs contravariants, et /'a/gèbre des tenseurs contra- 


o 
variants sur E, @ E, est définie par: 


a re) q 
QE= © ( :) 
g=0 
0 
de façon analogue, avec @ E = K (corps de base), 
1 2 
QE=E @QE=EQ@ _E, etc. 

En dehors des opérations fondamentales, addition et 
produit tensoriel, définies plus haut, il existe encore une 
opération qui, à un tenseur d'ordre N, associe un tenseur 
N-2, il s'agit de la contraction, qui consiste à égaler un 
indice de covariance et un indice de contravariance 
(pour faire donc après la somme sous-entendue par la 
convention d'Einstein), ce qui fait donc jouer aux espaces 


E et E* leur rôle de dualité; d'un tenseur de type AL 


on obtient donc un tenseur d'ordre R=). Cette opéra- 


tion pouvant être répétée tant que le tenseur obtenu est 
mixte. Par exemple, on sait identifier une matrice carrée 


à un tenseur mixte À du second ordre dont les coor- 


données x; sont les coefficients de la matrice. La contrac- 
tion lui associe un tenseur d'ordre 0, donc un scalaire 
qui n'est autre que la trace de la matrice 2 «. 
L'utilisation combinée de cette opération et du pro- 
duit tensoriel définit alors un produit contracté, obtenu 
par contraction d'indices dans le produit tensoriel. Ainsi, 
en prenant T défini par les composantes T#z et U par 
les composantes U!, on contracte le produit T @ U de 
composantes T#x Ulm = Vürlm en égalant / et &, ce qui 
donne un tenseur contracté (T @ U)c de composantes 
Vü;lm, soit Win, que l'on peut à nouveau contracter pour 
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obtenir un tenseur de composantes Wi#,, soit Zi après 
sommation. 

Deux exemples montrent bien qu'il s'agit d'un cadre 
abstrait général pour représenter des opérations déjà 
connues, mais dont la nature différente ne permettait pas 
de les associer. 

Prenons TE E* défini par ses coordonnées #; et 
XEE défini par ses coordonnées x'; le produit T @ X 
est défini par ses coordonnées #;xi que l'on note uii, et le 
produit contracté (T @ X) . est alors le scalaire ui? — txt, 
qui n'est autre que le produit scalaire usuel ÇT, X). 

En prenant maintenant un tenseur T mixte du second 
ordre, associé à une application linéaire L de matrice 
(a) et XEE défini par ses coordonnées x, le produit 
T@X a pour composantes uÿik = ajixk; la contrac- 
tion j — k donne un tenseur de composantes y! = x';x, 
c'est-à-dire que (T © X)e = L (X). 

Les tenseurs et les opérations définies sur eux permettent 
donc de définir une idée générale regroupant celles déjà 
obtenues par la linéarité, puis la multilinéarité. 

Enfin, une autre opération établit un lien avec l'analyse 
et la géométrie différentielle moderne : /e produit extérieur. 

2 


Dans l'ensemble @ E des tenseurs 2-covariants sur E, 
les expressions e? @ ei — ei @ ef, que l'on note ef A ei, 
sont des tenseurs alternés. La famille de ces vecteurs forme 
une base du sous-espace vectoriel A2 des tenseurs alternés 


2-covariants (sous-espace de @Q E), qui est donc de 
2 


: . n(n—1 
dimension 
Plus généralement, dans l'ensemble © E, les expressions 
? 
eli À eË À … À er = 
É e (o) eïol) @ eis®) © … @ eist) 
GeSp 


(où © désigne une permutation du groupe « symétrique » 
Sp, de signature = (5) [c'est-à-dire £ (s) = (—1)x où N 
désigne le nombre de transpositions de 6], pour 


1<h< io < … < ip AN) 


sont des tenseurs alternés p-covariants. La famille de ces 

tenseurs forme une base du sous-espace vectoriel A; des 

tenseurs alternés p-covariants (sous-espace de @ E) 
D 


qui est donc de dimension T- Cet espace vec- 


n! 
pl(n—p) 
toriel peut être ainsi considéré comme le produit extérieur 
de E p fois par lui-même, ce que l'on note À E = Av. 

D 


De l'idée ainsi développée pour E et ses vecteurs de 
base, on dérive l'idée généralisée de produit extérieur de 
deux tenseurs, application bilinéaire de A, x A, dans 
Ap 4 correspondant au produit tensoriel, application 
bilinéaire de Q E x © E dans @ E; mais ici le produit 

D q p+g 
tensoriel est insuffisant, car deux tenseurs alternés n'ont 
pas en général un produit tensoriel alterné. 

On définit pour tout tenseur p-covariant T un tenseur 


p-covariant alterné T, dit antisymétrisé de T, par: 


= 1 
T (x x, Xp) = — D € (6) T (Xou), Xo(), … Xo(p) 
pe; 6eS 
ES? 
en conservant les notations vues ci-dessus. 
Par exemple, 


: = 1 
sip = 2,T (x1, X2) = 5 [T (x1, X2) —T Gxex)|. 


Lorsque T est lui-même alterné, alors T = T; cette 
condition est donc nécessaire et suffisante pour qu'un 
tenseur soit alterné. Par conséquent, l'opération d'anti- 
symétrisation applique @ E dans son sous-espace À E; 

? ? 


c'est en fait une projection. 

Le produit extérieur de deux tenseurs T et T' est alors 
défini comme l'antisymétrisé de leur produit tensoriel, 
soit : T A T' = T @ T'; et cette opération est bien une 
application bilinéaire de A, X A dans A3 + 4%, qui est 
associative et non commutative ; on a, en fait, 


TA T= (Œ?2IT À T°: 


De même que l'on a construit @ E pour disposer d'une 
o 


structure respectant les produits tensoriels, on construit 
l'algèbre extérieure des tenseurs alternés covariants : 


we] 
A E= @® A» 
me) p=0 


en posant ÀAo = K. 


Bien évidemment, À E est une sous-algèbre de @ E. 
[a] o 
Les principes de dualité qui guident tout ce qui précède 
s'appliquent encore et permettent de définir, de manière 
duale, les produits extérieurs e;; À ei: À &is À … A Eig 


À g q 
et donc de poser Al] — A E, sous-espace vectoriel de @ E, 


de dimension er: Fe 

gl (n—g)! ke 
comme application projetant @ E sur À E. Le produit 
extérieur de deux tenseurs contravariants définit alors 
une application de Al#1 x All dans Alt + 9], qui conduit 
à poser l'algèbre extérieure des tenseurs alternés contra- 


ainsi que l'antisymétrisation 


co co 
variants À E comme la somme directe @ All, sous- 
© p=0 
algèbre de @ E. Dans ce cas, on peut donc définir le pro- 
duit extérieur de m vecteurs de E, analogue au produit 
extérieur de p formes linéaires sur E, puisque l'on peut 
identifier (par isomorphisme) tout vecteur de E à un 
élément du dual E*. 

Les produits extérieurs permettent de tracer un cadre 
simple pour les déterminants, en se plaçant dans l'espace 
Alr]l où n — dim E. Cet espace de dimension 1 admet la 
base el À e? À … A e*; la valeur de cette forme pour 
le n-uplet de vecteurs (X1, X2, …, Xh1) est le déterminant 
de ces n vecteurs par rapport à la base (ex, €2, …, en). 
Le calcul de déterminants trouve ainsi sa place normale 
dans le cadre général de l'algèbre multilinéaire qu'est 
l'algèbre tensorielle. 

L'algèbre extérieure trouve aussi une issue particulière- 
ment féconde dans le calcul différentiel sur une variété. 

Parmi les nombreuses applications des tenseurs, la 
théorie de la relativité utilise les notions fondamentales 
d'analyse tensorielle sur les espaces euclidiens réels et 
sur les espaces riemanniens. 

Pour tout vecteur X d'un espace euclidien réel E muni 
d'une base (e;), les composantes contravariantes x? sont 
définies par X — xie;:. La différentiation de cette égalité 
selon les règles classiques donne : 


dX = dxie; — xidei. 


Chaque vecteur de; peut être répété par ses composantes 
contravariantes que l’on note w/;, c'est-à-dire que : 


de; 7 ofe;. 
Par conséquent, après avoir redistribué les indices, on peut 
écrire : 
dX = (dxi + xkwîy) ei, 


ce qui montre que les composantes contravariantes du 
vecteur dX sont les quantités dx? + w?x;xX que l'on nomme 
différentielles absolues de x? pour chaque valeur de ;. 
Cette démarche peut être répétée, de façon analogue, 
pour un tenseur euclidien. Un résultat important, /e 
théorème de Ricci, a trait au tenseur fondamental gi; : 
la différentielle absolue du tenseur fondamental est nulle. 
L'utilisation des coordonnées curvilignes permet d'autre 
part de poser la notion de dérivée covariante, et de 
définir les symboles de Christoffel de première et deuxième 
espèces dont l'utilisation est très fréquente pour le calcul 
différentiel classique sur les champs de vecteurs. 
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Palais de la Découverte, Paris 


À Le mathématicien 
français Henri Poincaré 
(1854-1912). 


Figure 1a-1b : 

exemple graphique 
simplifié d'un procédé 
intuitif pour parvenir 

à la définition topologique 
de la notion de dimension. 


COURBES ET SURFACES 


L'Analysis situs, maintenant nommée topologie, a pris un 
second essor dès la fin du XIX® siècle. La topologie algé- 
brique s'est alors développée, prenant naissance essen- 
tiellement dans les travaux du mathématicien français 
H. Poincaré (1854-1912) pour devenir une branche auto- 
nome en pleine expansion grâce aux nouvelles techni- 
ques algébriques de classification. 


La dimension 


Une notion très utilisée est celle de dimension. Il est 
courant de dire que la droite est de dimension 1, le plan 
de dimension 2, l'espace ordinaire de dimension 3 et 
plus généralement que R7 est de dimension n. Essayons 
de trouver une définition générale. La notion de dimension 
ne peut pas appartenir purement et simplement à la 
théorie des ensembles puisqu'on peut établir une corres- 
pondance univoque et continue, mais non biunivoque 
entre R et R7. La dimension devra donc être définie par 
l'intermédiaire de considérations de topologie. 

Une première approche peut être la suivante : un plan 
peut être recouvert de rectangles (on pense alors à une 
paroi recouverte de bandes [fg. 1-a]). On peut trouver 
des points appartenant à trois rectangles, mais on peut 
éviter (en recourant à un recouvrement approprié) la 
présence de points appartenant à quatre rectangles. Une 


région spatiale peut être recouverte avec des parallélépi- 
pèdes : on peut toujours trouver des points communs 
à quatre parallélépipèdes et éviter la présence de points 
communs à plus de quatre parallélépipèdes (fig. 1-b). 
Le nombre critique, écrit en italique (trois, quatre), dépasse 
donc de 1 celui qu'on appelle naturellement la dimension 
de l'espace. 

Une approche assez naturelle peut être faite à l’aide 
de l'observation suivante : le contour d'une région tri- 
dimensionnelle est bidimensionnel, celui d'une région 
bidimensionnelle est unidimensionnel : en réalité, les 
choses ne sont pas toujours ainsi; la définition d'un 
contour doit alors être élaborée de façon plus précise, 
et c'est l'objet de l'homologie. 

Si E est un espace métrisable, on dit que celui-ci est : 


(1) de dimension — 1 s’il est vide; 
(2) de dimension < n (n = 0,1,2,..) en un de 
ses points x lorsque, pour tout voisinage V de x, 


il existe un voisinage U de x avec U € V, dont le 
contour est de dimension < n—1; 


(3) de dimension < n si en tout point sa dimension 
est < n; 

(4) de dimension » en un de ses points x lorsque 
sa dimension en x est < 7, mais non < n—1; 


(5) de dimension n si sa dimension est < n, mais 
non < n—1. 


Pour n — 0, (2) indique qu'un espace est de dimen- 
sion O en x si tout voisinage de x en contient un autre 
dont le contour est vide; si cela arrive pour tout x EE, 
la dimension de E est 0. On peut ensuite obtenir les espaces 
de dimension 1, et ainsi de suite. 

Par exemple, un espace qui contient un nombre fini 
de points est de dimension 0, R’ est de dimension n, 
tandis que Q7 est de dimension O. 

Notons la dimension de E par dimE,ona: 


dim (A U B) < dim A + dim B + 1; 
dim (A x B) < dim À + dim B 


si À et B ne sont pas tous les deux vides. 

La notion de dimension permet de définir d'une façon 
générale celle de courbe. Les courbes planes peuvent 
être définies comme des ensembles fermés et connexes 
(un sous-espace topologique E’ de E est connexe s'il 
n'existe pas deux ouverts disjoints de E, Us et Ub, tels 
que E’ & U: U U2) ne contenant aucun point intérieur: 
mais on ne peut pas définir d'une façon analogue les 
courbes non planes. Plus généralement, une courbe est 
un ensemble fermé et connexe à une dimension, cette 
définition étant topologiquement invariante. On définit 
l'ordre d'un point p d'une courbe comme le plus petit 
entier n tel qu'il y ait des voisinages de p, de diamètre 
arbitrairement petit, et dont les frontières contiennent au 
plus n points de la courbe. 

La notion de courbe continue est importante ; on appelle 
ainsi le chemin décrit par un point qui se déplace conti- 
nûment. On peut donc dire qu'une courbe continue est 
une image par une application univoque et continue du 
segment [0,1]. Le même point peut être l'image de 
plusieurs points du segment, et dans ce cas, il est point 
multiple de la courbe, ainsi la courbe de Peano (carré 
considéré comme une courbe de R2 et image du seg- 
ment [0, 1]). 
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Triangulation d'une surface 

Les faces d'un polyèdre de R3 sont des polygones, et 
on peut diviser un polygone en des triangles (voir Géo- 
métrie). La surface d'un polyèdre peut ainsi être considérée 
comme un système de triangles qui vérifie les conditions : 


(1) un point intérieur à un triangle n'appartient à 
aucun autre triangle; 

(2) chaque côté appartient à deux triangles qui 
ne possèdent comme points communs que ceux qui 
appartiennent à ce côté (triangles adjacents) ; 

(3) les triangles qui ont un sommet commun défi- 
nissent un cycle, deux triangles consécutifs étant 
adjacents; 

(4) entre deux triangles quelconques, on peut 
insérer une chaîne de triangles, deux triangles consé- 
cutifs étant adjacents. 


Toute image topologique d'un triangle ordinaire est 
appelée triangle (gauche). Toute surface peut être trian- 
gulée, c'est-à-dire qu'on peut la diviser en un nombre fini 
(si la surface est compacte) ou infini dénombrable de 
triangles satisfaisant aux conditions qui viennent d'être 
énoncées. Pour une même surface, il existe plusieurs 
triangulations vérifiant les quatre conditions mentionnées. 

On dit que deux surfaces sont équivalentes si on peut 
passer de l’une à l'autre par une déformation continue. 
On peut ainsi classer les surfaces, les surfaces compactes 
étant les plus faciles à classer. Tout d'abord, on distingue 
les surfaces orientables et les surfaces non orientables. 
Toute surface possède une décomposition en triangles 
(pour les hypersurfaces, il s'agira de simplexes): sur 
chaque triangle, on peut définir un sens de parcours (il 
en existe deux différents). Si, pour la surface S, chaque 
triangle de sa décomposition peut être orienté de telle 
facon que l'ensemble des orientations soit cohérent, on 
dit alors que la surface est orientable (fig. 2 et 3). 

Deux surfaces compactes sont équivalentes si et seule- 
ment si elles ont même type d'orientabilité et même carac- 
téristique d'Euler-Poincaré. La caractéristique d’une sur- 
face est un nombre entier qu'on calcule après avoir réalisé 
sa triangulation (on peut toujours décomposer une 
surface compacte en un nombre fini de polygones) : 
si S est le nombre de sommets, A le nombre d'arêtes, 
F le nombre de faces, on démontre que S— A+F 
est indépendant de la triangulation; ainsi dans l'espace 
à trois dimensions, on a : 


4 Toute surface peut 

être triangulée, c'est-à-dire 
qu'on peut la diviser 

en un nombre fini 

ou infini dénombrable 

de triangles. Ici, 

une surface courbe. 


Y Ci-dessous, figure 2 : 
triangulation 

d'une sphère (1); 

d'un cylindre (2); d'un ruban 
de Môbius (3); 

d'un tore (4). 

En bas, figure 3 : 

exécutant les identifications 
indiquées, on obtient 

Ja bouteille de Klein 

(à gauche) 

et le plan projectif 

(à droite). 


1.G.D.A. 


1.G.D.A. 


1.G.D.A. 


fig. 4 


A Figure 4 : 

pour le tore, 

la caractéristique 

S — À + Fest zéro; 

dans cette représentation 
« polyédrique », 

on a en fait : 

S = 9, A=18 F= 9. 


» Figure 5 : 

a, tore à une poignée : 
xv=1n=0; 

F=2, 

S = 2, A = 4. 

b, tore à deux poignées : 
2: n=—2. 
c, sphère 
(tore sans poignées) : 
y=0, n=2. 


+ = 


 Ci-contre, à droite, 
figure 6 : 

tout homéomorphisme 
d'un ouvert d'une variété 
topologique Vn 

sur une boule ouverte 
de R? est appelé 

une carte de Vn. 

v Figure 7: 

les deux cartes 

d'une sphère. 


S—A—F—=2 
pour tout polyèdre convexe; ce nombre est appelé carac- 
téristique d'Euler-Poincaré dela surface. 

La caractéristique d'une surface orientable s'écrit 
n = 2— 72 y, avec y entier positif ou nul, et on appelle + 
le genre de la surface ; pour une surface non orientable, on 
a : n—2— y, avec y entier supérieur ou égal à 1 
(fig. 4). 

Classer les surfaces consiste à énumérer les différentes 
classes de surfaces équivalentes. Le genre d'une surface 
compacte est un outil essentiel et direct pour la classifi- 
cation : ainsi, on montre que pour toute surface compacte 
orientable de genre y, il y a équivalence avec un tore à 
y poignées (fig. 5) [un tore à une poignée étant une sur- 
face obtenue en faisant tourner un cercle autour d'une 
droite de son plan qui ne la coupe pas]. 


Variété topologique et différentiable 


La topologie nous permet de préciser proprement les 
concepts de courbe, surface... 

En géométrie euclidienne et en géométrie analytique, 
on rencontre des types particuliers de courbes et de sur- 
faces (par exemple, les coniques et les quadriques). Nous 
verrons quelles sont les difficultés qui se présentent 
lorsqu'on cherche à passer à une définition générale. La 
droite s'identifie (en géométrie analytique) avec l'en- 
semble R. On dit qu'une courbe est un ensemble équi- 
potent à R, mais ce concept est trop général puisque le 
plan est aussi équipotent à R. En entendant par courbe 
un espace homéomorphe à R, on exclut par exemple la 
circonférence, et maintenant notre notion est trop res- 
treinte. Une courbe est plutôt un espace /ocalement 
homéomorphe à R, c'est-à-dire homéomorphe morceau 
par morceau (chaque point possède un voisinage 


homéomorphe à un intervalle), et une surface est un 
espace localement homéomorphe à R2. 

Tout ceci amène à la définition de variété topologique. 
Une variété topologique VA} est un espace qu'on peut 
recouvrir d'ouverts, chacun d'eux étant homéomorphe 
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à une boule ouverte de R* : la variété qui en résulte est 
de dimension n7. Tout homéomorphisme d'un ouvert V» 
sur une boule ouverte de R? est appelé une carte de Va. 
Sixe V, : il peut arriver que x appartienne au domaine de 
deux cartes © et (fig. 6). Alors, en lui associant les 
points du type © (x), Ÿ (x), on obtient un homéomor- 
phisme d'un ouvert de R? sur un autre : celui-ci s'appelle 
changement de carte. Si © (x) ainsi que F (x) sont des 
n-uplets de nombres réels : © (x) — (x1, x2, …, Xn) et 
F (x) = (y1, V2, …, Yn), alors le changement de carte 
se représente par les équations : 
yi = fi (xx) 

les fonctions f; étant continues et inversibles. 

On dit que V,, est une variété différentiable de c/asse C” 
(ou une r-variété) si elle est une variété topologique dotée 
d'une carte telle que tout changement de carte se passe 
par des fonctions f; de classe C’, c'est-à-dire continues 
et admettant des dérivées (par rapport aux xx) continues 
au moins jusqu'à l’ordre r. On remarquera que les variétés 
de classe C5, pour s > r, sont des cas particuliers de celles 
qui sont de classe C’. S'il existe des dérivées continues 
de tous ordres, on parle de classe C®, et si les f; sont des 
fonctions développables en séries entières au voisinage 
de chaque point, on parle de variétés analytiques où de 
classe Ce. 

On dit aussi que les cartes ©, F... définissent un at/as 
de classe C’, de R? sur V, ; l'ensemble des points de tous 
les atlas de classe C’, pour lesquels les changements 
réciproques de carte sont de classe C”, définissent sur Va 
une structure de variété différentiable. 

Par exemple, une surface sphérique est une variété 
analytique représentable avec non moins de deux cartes 
(fig. 7) ; un plan projectif est une variété analytique repré- 
sentable avec non moins de trois cartes; un tore est aussi 
une variété analytique, etc. 


Simplexes 


Pour généraliser les notions et les résultats de triangu- 
lation, de surface orientée, etc., à des courbes et des sur- 
faces, non plus dans des espaces de dimension trois, mais 
dans des espaces de dimension quelconque, on a recours 
à des outils plus abstraits. Les simplexes et la topologie 
algébrique (homologie, homotopie) sont à la base de 
cette extension. 

Une branche assez importante de la topologie est la 
topologie algébrique, dans laquelle on applique de façon 
intensive les notions et les techniques de l'algèbre abstraite. 
Par exemple, la formule d’Euler s'obtient en faisant appel 
à la topologie algébrique. Plus généralement, pour un 
polyèdre dont la surface n'est pas homéomorphe à celle 
d'une sphère, le nombre S — À + F varie : par exemple, 
il prend la valeur zéro pour le tore (fig. 5). L'idée globale 
est d'exprimer des propriétés topologiques par l'inter- 
médiaire de caractères algébriques (la théorie des groupes 
y intervient de facon fondamentale) et numériques. 

On se place dans un espace euclidien de dimen- 
sion n, E. Soit Xo, X1, …, Xp, p +— 1 points linéairement 
indépendants dans E. Alors, l'ensemble S des points 
(y1, y2, …, y?) de E vérifie : 


1.G.D.A. 


k=p 


ÿi= 2. Dex (pour1 <i<n) 
k=0 
k=p 
2x <O et S =1 
k = 


s'appelle le p-simplexe euclidien de sommets Xo, x1, 
noté (xo, X1, …, Xp). : ee 
Par exemple, si p — 2, soit zle point qui divise le seg- 


pr 


22 : de cer à 
ment x1x2 dans le rapport —, alors le point qui divise le 
ÀI 


1 "- Jo 


Di 2 " É 
segment xoz dans le rapport ———— est bien un point 
À0 


du 2-simplexe, qui est donc formé par les points du 
triangle xox1x2. 

On peut raisonner de manière analogue pour montrer que 
le 3-simplexe de sommets xo, x1, X2, x3 est le « tétraèdre » 
défini par ces points (ce qui nous permet de deviner intui- 
tivement que le 1-simplexe de sommets xo et x1 n'est autre 
que le segment d'extrémités xo et x1). 


A chaque valeur du (p — 1)-uplet (20, 21, …, À») de 
k=p 

nombres positifs tels que pi Ar = 1,correspond un point 
k=0 


du simplexe. La correspondance ainsi définie est bijec- 
tive, en raison de l'indépendance linéaire des x;. C'est 
pourquoi l'on peut dire que les scalaires X0, 21, …, Ap 
s'appellent les coordonnées barycentriques du point 
(y1, y2, …, y) correspondant dans le simplexe. 

Pour caractériser, dans le 3-simplexe euclidien, ses 
faces — au sens usuel — on peut voir que chacune d'entre 
elles n'est autre que le 2-simplexe défini par les 3 som- 
mets de cette face. Ceci amène à définir, d'une manière 
plus générale, une face m-dimensionnelle, qui est le 
m-simplexe de m sommets choisis parmi les p du sim- 
plexe de départ. On utilise le terme de face — sans 
préciser plus — lorsque m—p—1; les faces d'un 
1-simplexe de sommets xo et x1 sont donc les deux som- 
mets, par exemple. Il Y a donc (p — 1) faces pour un 
p-simplexe euclidien. Ainsi, si dans la définition du 
p-simplexe, on prend successivement : 

20 = 0, 21 = 0, xp = 0, 
alors les points obtenus décrivent chacune des (p — 1) 
faces du p-simplexe. 

On citera deux propriétés essentielles des simplexes 
euclidiens. 

Propriété 1 : tous les points d'un segment joignant 
deux points d'un simplexe sont dans le simplexe; autre- 
ment dit, tout simplexe euclidien est convexe. 

Propriété 2 : le p-simplexe S de sommets xo, X1, …, Xp 
est exactement formé de l'ensemble des points des seg- 
ments qui joignent chaque sommet x; à la face opposée 
(c'est-à-dire la face obtenue en prenant 2x — 0). 

Parmi les simplexes simples, on peut citer surtout le 
p-simplexe euclidien standard À, (de l'espace à p — 1 
dimensions), où les sommets sont formés des suites de 
nombres (0, 0, …., O, 1, 0, 0) où seule une coordon- 
née est non nulle et égale à 1. Dans cet exemple (que 
l'on peut rapprocher de la base « canonique » de R?), la 
recherche des coordonnées barycentriques d'un point 
du simplexe est très aisée; on a en fait : Àx — y* *1, où 
y +lest la (k — 1)-ième composante du point y de Az. 

Supposons maintenant donné S, un p-simplexe eucli- 
dien (xo, x1, …, Xp). Il existe une application linéaire et 
une seule de À, sur S telle que l'image du /-ième som- 
met (0, O0, …, 1, …, 0), où le terme non nul est à la /-ième 
place de À,, soit x; 1. Cette application est de plus 
continue ; on la nomme p-simplexe singulier associé àS$, 
et on la note (xo, X1, …, Xp). Plus généralement, on appelle 
p-simplexe singulier une application continue de A, 
dans E (espace euclidien de dimension p +— 1). C'est à 
l'aide de ces applications que l'on construit maintenant 
ce qui correspond à notre idée intuitive de courbe limitant 
une surface (ou encore de surface limitant un solide), 
c'est-à-dire le bord d'un simplexe. 

Dans un p-simplexe, on a pu définir (p — 1) faces, qui 
sont chacune un (p — 1) simplexe. On pourrait de même 
penser à « remonter » un simplexe par ses faces; pour cela, 
et compte tenu de la nécessité de disposer d'une structure 
(loi interne, par exemple additive) algébrique, on définit 
une p-chaîne ou chaîne p-dimensionnelle de E comme 
une combinaison linéaire à coefficients entiers de p-sim- 
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plexes singuliers de E, soit une expression de la forme 
bi nisi, où seul un nombre fini de »n; sont non nuls. On 


Li 

choisit n; € Z, de telle façon que les p-simplexes singuliers 
de E engendrent ainsi un groupe abélien additif C» (E), 
dit groupe des p-chaines de E. 

Le bord d'un simplexe est alors défini par une opération 
qui, composée avec elle-même, est identiquement nulle. 
Ceci est naturel; en effet, le bord d'un triangle (son péri- 
mètre), le bord d'un segment (ses extrémités) ont leurs 
bords respectifs réduits à zéro. L'extrapolation au p-sim- 
plexe est donc pleinement justifiée. D'autre part, pour la 
même raison qui nous a fait définir une p-chaîne de E 
à partir de p-simplexes singuliers, c'est sur des p-sim- 
plexes singuliers que l'on définira l'opération passage au 
bord. Soit donc (Xxo, X1, …, Xp) Un p-simplexe singulier, 
on désigne par fx le (p — 1)-simplexe singulier associé 
à la face opposée au sommet xx. Alors l'opérateur bord 
d'est défini par: 

k=p 
d'Éox1… xp) = D (—1) fx 
k=0 
On en déduit alors que l'on a bien d? (xo, x1, …, Xp) = 0. 
D'autre part, on définit le bord d'une p-chaïine 2. niSi 
ul 
par 2 nids; et, en particulier si C est une O-chaïine de E, 


1 
on pose dC = 0. 

Ceci amène à envisager toutes les p-chaînes dont le 
bord est nul, afin de retrouver parmi elles celles qui sont 
des bords. On appelle p-cycle dans un espace E une 
p-chaîne C telle que dC = O. 

On complète cet ensemble de définition en appelant 
p-bord de E toute p-chaîne B de E telle qu'il existe une 
(p + 1)-chaîne C de E vérifiant B — dC. 
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A Une surface 

de Riemann : /es travaux 
du mathématicien 
allemand sur les relations 
entre la théorie 

des fonctions et la théorie 
des surfaces 

sont considérés comme 
les premières bases 

de la topologie. 


<« Une surface courbe. 


Palais de la Découverte, Paris 


À Rotation 
d'une surface réglée 
de Môbius. 


Figure 8 : 
généralisation 

des notions d'homologie 
(voir développement 
dans le texte ci-contre). 


Notions d’homologie 

Les p-cycles de E forment un sous-groupe de C> (E), 
que l’on notera Z» (E), les p-bords de E forment un sous- 
groupe de C> (Ë), que l'on notera B; (E). L'opérateur 
bord, soit d, définit un homomorphisme de C; (E) dans 
Cp -1 (E) pour lequel Z; (E) et B> (E) sont respecti- 
vement le noyau et l'image. Puisque la relation d?— 0 
est vérifiée pour toute chaîne, il s'ensuit que 


Bp (E) € Zp (E); 


plus exactement, B; (E) est un sous-groupe de Z; (E). 

L'idée générale de l’homologie est alors d'effectuer 
une classification parmi les cycles de E. Non pas pour 
énumérer ceux d’entre eux qui sont des bords, mais en 
vue de leur distinction ultérieure. 

Soit deux p-cycles À et B de E. S'il existe une 
(p + 1)-chaîne C de E telle que A— B = dC, on dit 
alors que À et B sont homologues dans Z; (E), ce 
qu'on écrit A + B, car il s'agit bien d'une relation d'équi- 
valence entre p-cycles. Les classes d'équivalences pour 
cette relation dans Z, (E) sont appelées classes d'homo- 
logie de dimension p sur E. C'est évidemment de ces 
classes d'homologie que l'on peut arriver à faire une 
liste simple. Mais la relation d'homologie n'est autre que : 
A-=-B< A—BEeB, (E). Les classes d'homologie qui 
nous intéressent ne sont donc autres que les éléments du 


groupe quotient 2p Le À (E) que l'on appelle p-/ème 
p 


groupe d'homologie de E, ou encore groupe d'homologie 
p-dimensionnel, et qu'on désigne par H> (E). 

L'étude de la structure de ces groupes, de leurs géné- 
rateurs et des liens entre ceux-ci permettra de déterminer 
les bords dans E. 

On dit que les p-cycles C1, C2, …, Cm sont linéairement 
indépendants dans E si la seule combinaison linéaire 
a1C1 + a82Co + … amCm à coefficients entiers, homologue 
à zéro [donc bord d’un (p + 1) cycle], est celle pour 
laquelle 41 — 82 = … — 8m = 0. C'est le plus grand 
nombre de p-cycles linéairement indépendants d'une 
variété V que l’on appelle le nombre de connexions, où 
nombre de Betti, de dimension p de V. 


172 


Richard Colin 


Un cas particulier est celui d'un p-cycle C non homo- 
logue à zéro, mais pour lequel il existe un nombre keN 
tel que &C = 0; alors le plus petit entier & qui réalise 
cette condition est appelé le coefficient de torsion de 
dimension p de V. 

Le p-ième groupe d'homologie d'une variété V est 
somme finie de groupes cycliques, et le nombre de 
connexions de dimension p n'est autre que le nombre 
des groupes cycliques infinis intervenant dans H; (V): 
tandis que les ordres des groupes finis sont des multiples 
du coefficient de torsion de dimension p de V. Les re/a- 
tions de dualité de Poincaré montrent l'égalité, pour une 
variété compacte et orientable de dimension p, des nom- 
bres de connexions de dimensions n et p — n, ce pour 
toutes les valeurs de n entières comprises entre 0 et p; 
ainsi que l'égalité des coefficients de torsion de dimen- 
sions » et p— n— 1 pour les mêmes valeurs de n. 

Les nombres de connexions possèdent la propriété 
fondamentale d'être invariants pour tout homéomor- 
phisme de V. 

Le théorème de dualité d'Alexander pour les sommes 
finies de simplexes globalise un certain nombre de résul- 
tats tels que le théorème de Jordan sur la découpe en 
2 parties du plan euclidien par une ligne simple fermée, 
ou le théorème de Brouwer (qui généralise le résultat 
précédent à une variété compacte de dimension p—1 
dans un espace de dimension p}), où encore le théorème 
de l'invariance de la dimension topologique. 

Si K désigne un nombre fini ou une infinité dénom- 
brable de simplexes tels que deux simplexes quelconques 
aient soit un côté commun, soit une intersection vide, 
et que tout point de K appartienne à un nombre fini de 
simplexes (alors on dit que K est un complexe, de dimen- 
sion » si tous les simplexes ont une dimension au plus 
égale à n), alors le nombre de connexions de dimension 
r de k est égal au nombre de connexions de dimension 
n—r—1 de l'ensemble CE. 

La généralisation des notions précédentes permet de 
décrire des cas tels que celui d'une pomme rongée par 
deux vers, où les canaux tracés ne se rencontrent pas 
et ne forment donc jamais une coupure du fruit, mais 
néanmoins délimitent une bordure des chemins suivis 
(fig. 8). Soit donc E un espace et F un sous-espace. 
Un p-cycle relatif de E modulo F est une p-chaîne C 
de E telle que dC soit une (p— 1) chaîne de F. De 
manière analogue, un p-bord relatif de E modulo F 
est une p-chaîne B de E, telle qu'il existe une p-chaîne s 
de F et une (p — 1) chaîne t de E vérifiant dt = s + B, 

Les p-cycles relatifs de E modulo F forment un sous- 
groupe de C> (E) qu'on note Z» (E,F); les p-bords 
relatifs de E modulo F forment un sous-groupe de C> (E), 
noté B> (E, F), et on voit que B; (E, F) est un sous- 
groupe de Z> (E, F), ce qui permet de définir le p-ième 
groupe d’homologie relatif de E, modulo F, soit 


Zp (E,F) 
HE P= le, (E, F)' 


Ce groupe contient comme éléments les classes de 
p-cycles relatifs de E modulo F, pour la relation d'équi- 
valence définie par : deux éléments de Z, (E, F) sont équi- 
valents si leur différence est un élément de B, (E, F). 

Le calcul des groupes d'homologie et d'homologie re- 
lative permet ainsi une connaissance plus précise des pro- 
priétés topologiques de toutes les surfaces n-dimension- 
nelles. Un outil très précieux dans les calculs de certains 
groupes d’homologie est le théorème d'excision qui 
montre que l'homomorphisme : 


Hp (E—U,F—U) = H, (EF) 
induit par l'application inclusion est un isomorphisme 


dès que U est un sous-ensemble de F tel que UC F 
— avec F sous-espace de E — et ce pour toutes les valeurs 
de p. Autrement dit, il est possible de supprimer (d'ex- 
ciser) certains sous-ensembles dans F, sans pour autant 
que l'homologie relative (et là réside un grand intérêt 
de cette généralisation) de E modulo F soit transformée. 


Notions d'’homotopie 


Un aspect très intéressant de la topologie algébrique 
est la théorie de l'homotopie des arcs. 

Soit | l'intervalle formé [0, 1] de R, muni de la topo- 
logie induite par celle de R. Un arc x d'un espace topo- 
logique E est une application continue de | dans E, 
c'est-à-dire une fonction continue & (t) (0 <« t < 1) dont 
les valeurs sont des points de E. Ordinairement, pour 
tout arc « on a une courbe image, lieu des points de E 
qui sont images par « d'un point de |; mais l'arc ne se 
réduit pas à un tel lieu, il est plutôt une de ses repré- 
sentations paramétriques. Ainsi, dans ÆR?, les arcs 
xx = kt? et xx — kt ont la même courbe image — le 
segment d'extrémités (0, 0) et (1, 2) — mais sont diffé- 
rents. En général, si f est un homéomorphisme de | 
dans lui-même, l'application composée de fet x, soit #7, 
a la même courbe image que l'arc 4. Puisque l'on n'a pas 
demandé que x soit injective, un point de E peut être 
image de plusieurs points de |. Dans cet ordre d'idée, 
Peano a construit un arc de R? dont la courbe image est 
un carré. Les points « (0) et x (1) sont appelés les extré- 
mités de l'arc «; lorsque x (0) — x (1), on dit que l'on a 
un /acet, et si « (t) est constant, on parle d'arc nul. 

Dans l’ensemble des arcs de E, on introduit une opéra- 
tion non définie partout : le produit homotopique. Étant 
donné deux arcs de E, x et 8, leur produit «8 (dans cet 
ordre) est défini si « (1) — 8 (0) et est donné par: 

1 


x (29 pour0<t< > 


1 
8(2t—1)pour; <t<1 


Une telle application est continue, et manifestement on a : 
ag (0) = x (0) et ap (1) =8 (1) 

Intuitivement, on peut interpréter { comme une variable 
intermédiaire ; alors x et 8 sont les lois horaires de deux 
mouvements dans E, qui se développent dans l'unité 
de temps |; «8 est alors une nouvelle loi horaire qui se 
réalise en effectuant dans la première moitié de | le mouve- 
ment « à vitesse double, et dans la seconde moitié, le 
mouvement 8 également à double vitesse. Le produit 
homotopique définit dans l'ensemble des arcs de E une 
structure algébrique. 

Convenons maintenant de définir dans un tel ensemble 
une relation d'équivalence, l'homotopie. On dira que 
deux arcs x et y de E sont homotopes (fig. 9) s'il existe 
une application continue H de |? dans E telle que : 

{ H (4 0) = « (t) 

UH(£1) = 7 () 

Il est ensuite utile de considérer une relation plus forte, 
dite d'homotopie relative (—), qu'on a lorsque x, y, H 
satisfont en plus de H: à : 

[ æ (0) = y (0) = H (0, u) 
Le ()= STD) = HAL) 

D'un point de vue intuitif, on peut dire que x et 8 sont 
homotopes lorsque l'on peut transformer par continuité 
l'un en l'autre; en posant u = uo, H (é, uo) est alors un 
des arcs qui réalise un tel passage. 


Inversement, si l'on pose {= to, H (fo, u) est l'arc 
décrit par un point dans la transformation. Dans l'homo- 


«8 (t) = 


î 


Hi) 


H2) (fig. 10) 


topie relative, on désire que tous les arcs H (é, uo) — et 
de là en particulier x et ÿ — aient les mêmes extrémités. 

Il est facile de vérifier que les deux relations sont des 
relations d'équivalence. En outre, le produit homoto- 
pique est compatible avec l'homotopie relative, c'est-à- 
dire que si « æ y et 8 + à et si «8 existe, alors y est 
aussi défini et «8 + yà (fig. 11). 

On appelle classes d'homotopie d'un point x de E les 
classes d'équivalence de l'homotopie relative dans l'en- 
semble des lacets ayant leurs extrémités en x. Désignons 
par C+ la classe à laquelle appartient le lacet x; on peut 
alors définir une opération interne dans l'ensemble C 
des classes C: comme suit : 


Cx Ce = C8 


(en fait, si yeCx et 5e Cs, alors Cys — Cxg, et par 
conséquent il en résulte des opérations qui dépendent 
seulement des classes C+, C3 et non des arcs x, 8). Cette 
opération est toujours définie et fait de C un groupe que 
l'on appelle groupe d'homotopie de x. 

On dira que E est connexe par arcs si, pour tout couple 
(x, y) de points de E, il existe toujours un arc de E d'extré- 
mités x et y. Si E est connexe par arcs, les groupes d'homo- 
topie de ses points sont isomorphes à un même groupe 
que l’on appelle groupe fondamental, ou premier groupe 
d'homotopie, ou groupe de Poincaré de E, et que l'on 
note 7 (E). Deux espaces homéomorphes ont le même 
groupe fondamental. 

Le plan R?, l'espace R3, une surface sphérique, bien 
que n'étant pas homéomorphes, ont le même groupe 
d'homotopie : en fait, deux arcs avec les mêmes extré- 
mités sont relativement homotopes, et de là, à tout point 
on peut associer une seule classe d'homotopie; alors 
7 (E) se réduit à un groupe à un élément: l'élément neutre. 

Dans la couronne circulaire, on a inversement des 
lacets non homotopes au lacet nul (fig. 12-1), et le groupe 
d'homotopie est isomorphe au groupe additif des entiers 
relatifs (Z +). Sur le tore (fig. 12-2) on a deux types de 
lacets non homotopes au lacet nul et non réductibles 
l’un à l’autre; c'est pourquoi, dans ce cas, x (E) est iso- 
morphe au groupe additif des nombres complexes x + jy 
tels que x et y soient entiers. 
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<« Figure 11 : 

le produit homotopique 
est compatible avec 
l'homotopie relative. 


1.G.D.A. 


À En haut, figure 9 : 
l'homotopie de deux arcs. 
Ci-dessus, figure 10 : 
l'homotopie relative. 


« Figure 12 : 

lacets homotopes 

au lacet nul (en rouge) 

et non homotopes 

au lacet nul (en bleu 

et en vert) illustrés par 
l'exemple d'une couronne 
circulaire (1) et par 

celui d'un tore (2). 


Giraudon 


Y Le ruban de Môbius. 


La notion d'homotopie s'étend aux applications conti- 
nues d'un espace donné X dans un espace donné E : 
l'homotopie entre les applications f et g est réalisée par 
une application continue H de X x | dans E avec 

[H(x 0) =f (x) 

LH EDS 7 

En particulier, appelons S, la sphère n-dimensionnelle, 

i=n—+i 
lieu des points de R’* -1 tels que a x2=1;0on 
i=1 

peut étendre les considérations précédentes et obtenir 
un nouveau groupe 7» (E). 

La théorie des applications homotopes étend consi- 
dérablement la notion de continuité. Certains résultats 
combinent homotopie et groupes d’homologie; le prin- 
cipal d'entre eux est : 

soit X et E deux espaces topologiques, Y et F respec- 
tivement deux sous-espaces. Soit f et g deux applica- 
tions de X dans E, telles que Y soit appliqué dans F, et 
homotopes. Si l’on désigne par f, et g, les morphismes 
de H» (X, Y) dans H3 (E,F) induits par f et g, alors 
f, = g,, et ce pour toute valeur de p. 

En conséquence, si f:X —E et g:E — X continues 
sont telles que f (Y)  Fet g (F) & Y et si f-.g est 
homotope à l'identité de E et g « f homotope à l'identité 
de X, alors le morphisme f, induit par f, 


F,: Hp (X Y) + Hp (EF) 


est un isomorphisme pour tout p € N. 

Il résulte encore de là que si E et F sont des espaces 
topologiques, f:E—F et g:F—E des applications 
continues, alors, si f « g et g - sont homotopes aux appli- 
cations identités de F et de E respectivement, alors : 


f, : Hp (E) + Hp (F) 


induit par f est un isomorphisme, pour toute valeur de p. 

L'homotopie et l'homologie permettent ainsi de dis- 
tinguer, du point de vue topologique, des espaces que 
l'on pourrait croire homéomorphes alors qu'ils ne le sont 
pas. 


pourtoutxe X 
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STATISTIQUE ET PROBABILITÉS 


Généralités 


Chacun sait ce que signifie le concept de statistique. On 
fait la statistique des accidents de la route, du nombre 
de naissances ou des gagnants à la Loterie nationale. 
Cela veut dire que l’on compte le nombre des accidents 
de la route qui se sont produits dans un laps de temps 
donné, ou celui des naissances survenues dans la popu- 
lation de tel où tel pays, ou enfin celui des personnes qui 
ont eu la chance de gagner telle ou telle somme à la 
Loterie. 

La statistique est donc simplement une technique, une 
sorte de comptabilité des événements qui se sont pro- 
duits dans le passé. 

La notion de probabilité est liée à cette technique, mais 
elle est tournée vers le futur. Si je vous demande : que 
va-t-il vous arriver cette année ? La réponse à ma ques- 
tion contiendra la notion de probabilité. À la base de 
cette notion on trouve une supposition fondamentale 
a priori : à savoir que, toutes choses égales par ailleurs, 
les divers événements dont on a fait la statistique sont 
équivalents, en ce sens que chacun d'eux a une égale 
probabilité de se reproduire dans le futur comme il s'est 
produit dans le passé. Ainsi, si une partie de pile ou face 
a donné jusqu'à maintenant 60 « piles » et 40 « faces », 
on considérera que chacun de ces 100 événements a la 
même probabilité de se reproduire au 101® essai, et que 
par conséquent, pour ce nouvel essai, on a 60 % de 
chances d'obtenir « pile » ou simplement que la proba- 
bilité d'obtenir « pile » est 0,6. Cette équivalence des 
divers événements passés n'est, soulignons-le, rien de 
plus qu'une hypothèse de travail, que rien ne justifie, 
si ce n'est son efficacité pratique. 


La probabilité intrinsèque 

La notion empirique de probabilité qui résulte d'une 
statistique est, naturellement, toujours sujette à révision. 
Chaque fois qu'une nouvelle expérience est faite, le 
résultat de cette expérience modifie, en général, les pro- 
portions entre les divers résultats survenus, et donc la « pro- 
babilité » de chacun d'eux pour un essai ultérieur. Le 
concept de probabilité s'affranchit de cette contrainte 
et acquiert une indépendance par rapport à l'expérience, 
si nous supposons qu'il existe une grandeur appelée 
probabilité intrinsèque, liée à chaque événement suscep- 
tible de se produire, grandeur dont les statistiques donnent 
une évaluation plus ou moins approchée. 

Ainsi, nous pouvons attribuer, pour des raisons de 
symétrie évidentes, à l'événement « pile » la probabilité 
intrinsèque 0,5, et affirmer que l'évaluation de cette 
probabilité au terme de 100 parties (0,6 dans notre 
exemple) ne constitue qu'une évaluation grossière de la 
probabilité intrinsèque. 

Il est possible de démontrer, sous des conditions très 
générales, que l'évaluation des probabilités intrinsèques 
(auxquelles nous réserverons par la suite le terme de pro- 
babilité) au moyen d'une statistique est d'autant meilleure 
que le nombre d'événements enregistrés dans la sta- 
tistique est plus grand. 


L'espace d'événements possibles 

On se demande souvent quelle est la probabilité de tel 
événement, alors même qu'aucune expérience n'a été 
faite pour donner une statistique à cet égard. On considère 
alors l’ensemble des événements possibles, ou plus pré- 
cisément, l'ensemble des résultats physiquement dis- 
tincts pouvant résulter d'une épreuve où d'un essai. 
Cet ensemble forme l'espace des événements possibles. 
Il est parfois utile de se représenter cet espace. La figure 1 
illustre, par exemple, l'espace 6 des événements possibles 
pour un tirage de dés. 


L'hypothèse d’égale probabilité a priori 

Afin de répondre à une question « probabilistique » du 
type : quelle est la probabilité de tirer un chiffre pair en 
jetant le dé? on énumère les événements favorables, 
c'est-à-dire, dans ce cas, les événements « sortie d'un 2», 
« sortie d'un 4 », « sortie d'un 6 ». Le rapport entre le 
nombre des événements favorables (N;) et le nombre total 
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des événements possibles (N) est, par hypothèse, la 
probabilité en question. On écrit : 


Li 
NÉ 


Ici encore, l'évaluation de la probabilité est fondée sur 
une supposition a priori : celle de l'équivalence de chacun 
des événements élémentaires qui forment l'espace des 
événements possibles. C'est cette hypothèse, par exemple, 
qui nous a permis d'attribuer la probabilité 0,5 à chacun 
des événements « pile » et « face », parce qu'il n'y a dans 
ce cas que deux événements possibles, et qu'ils sont 
considérés comme équivalents. 

La fécondité de cette hypothèse, qu'on appelle sou- 
vent l'hypothèse d'égale probabilité a priori, est l'unique 
justification qui puisse en être donnée. Dans certains cas, 
la fécondité de cette hypothèse résulte de la propre volonté 
des observateurs. Dans les jeux, par exemple, on cherche 
délibérément à créer les conditions de son application, 
sans jamais y parvenir parfaitement; car, comme on peut 
le remarquer, chaque face d'un dé diffère des autres par 
un détail quelconque, sans quoi il ne serait pas possible 
de les distinguer. En fait, on rencontre dans la nature d'in- 
nombrables cas où l'hypothèse d'égale probabilité a priori 
se révèle d'une fécondité surprenante, à tel point que l'on 
peut se demander si l'on a bien compris toute la portée 
ou toute la signification d'un tel succès. 


(1) P— 


Probabilités composées : 
lois de composition 


Événements élémentaires et événements composés 

Considérons un espace d'événements élémentaires, 
par exemple celui des résultats possibles du tirage d'un dé. 
A chaque question probabilistique on peut associer l'en- 
semble des événements élémentaires favorables, qui, 
conformément à la relation (1), permet de calculer la 
probabilité en question. 

Un tel ensemble d'événements élémentaires favorables 
est aussi appelé, par extension, un événement. Ainsi, 
nous demanderons : Soit À le sous-espace de 6 tel 
que, quelle est la probabilité pour que l'événement A 
se produise ? Dans le jeu de dés, on peut définir, par 
exemple, l'événement À comme « sortie d'un chiffre 
impair », l'événement B « sortie du chiffre un », l'événe- 
ment C « sortie des chiffres 5 ou 6 », D « sortie d'un chiffre 
pair », etc. Graphiquement (f/g. 2), à chacun de ces événe- 
ments correspond une région de & contenant exclusive- 
ment les événements élémentaires favorables. 

Quelle que soit la définition de l'événement E, la rela- 
tion (1) indique que 


(2) O0 & Prier € T: 


On peut construire, à partir des événements ainsi définis, 
d'innombrables autres événements ; « À et B », par exem- 


ple, est le sous-espace contenant l'ensemble des événe- 
ments élémentaires favorables à la fois à À et à B; 
« À où B » est l'événement formé par les événements 
favorables, soit à À, soit à B. Appelant E et F, respective- 


ment, les événements précédents (fig. 3), on écrit : 
E=ANB 
F= AU B. 


— Si À et B s'excluent mutuellement, c'est-à-dire 
s'ils n'ont aucun événement élémentaire en commun, E est 
vide : 

Pr{E} = 0. 


— Si À UÜ B — 6, et si À et B s'excluent mutuelle- 
ment, on dit que À et B sont complémentaires. On écrit 
B = A. Il est clair que Pr {A U A} = Pr {6} = 1. 

La signification de ces termes devient évidente si l'on 
considère des exemples particuliers, comme celui du 
jeu de dés cité plus haut. Dans la figure 2 les événements 
B et C sont exclusifs, les événements A et D sont complé- 
mentaires. De facon générale, les événements élémen- 
taires de-n‘importe quel espace des événements possibles 
sont toujours mutuellement exclusifs. 


Probabilités conditionnelles 

Il est parfois important de considérer un événement 
particulier comme définissant un nouvel espace des événe- 
ments possibles. C'est le cas, par exemple, pour la question 
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À À gauche, figure 1 : 
l'espace 6 des événements 
possibles pour un tirage 

de dés. 

A droite, l'évaluation 

de la probabilité est fondée 
sur une supposition a priori: 
celle de l'équivalence 

de chacun des événements 
élémentaires qui forment 
l'espace des événements 
possibles. 


Y Figure 2: 

à chacun des événements 
A, B, C'et D, correspond 
une région de 6 contenant 
exclusivement les 
événements élémentaires 
favorables. 


= 
© 
© 
TB 

S 
el 
[au 


A Figure 3 : 
voir développement 
dans le texte. 


suivante : « quelle est la probabilité d'avoir tiré un 1 si, 
pour une raison quelconque, nous savons que le résultat 
du tir est impair? » Une telle probabilité est appelée 
probabilité conditionnelle, et l'événement G correspon- 
dant se met sous la forme : 


G = B/A. 


Pr (B/A) est donc la probabilité pour que B se produise, 
sachant que A s'est effectivement produit. On a : 
N; 


Na 


Pr {G} = Pr {B/A} — 


Lois de composition 

La relation précédente donne immédiatement le moyen 
d'établir deux théorèmes fondamentaux de la théorie des 
probabilités. Étant donné que : 


N; 
Pr {BA} = me 
peut s'écrire : 
N; 
N  Pr{ANB} 
Pr {B/A} x PA} 
N 
on obtient : 


(3) Pr {A N B} = Pr {A} x Pr {B/A}. 


D'autre part, le comptage des événements favorables 
pour l'union de deux événements donne immédiatement : 


Pr {A Ü B} = Pr{A} + Pr{B}— Pr {AN B} 


expression dans laquelle le dernier terme compense le 
fait que les événements de la région commune à A et B 
sont contenus dans chacun des termes précédents et sont 
donc comptés deux fois dans la somme de ces termes. 
Si À et B sont exclusifs, Pr {A N B} est nulle. 

La formule précédente se réduit alors à : 


(4) Pr {A U B}, A et B exclusifs — Pr {A} + Pr {B} 


Tribus et espaces probabilisables 

La possibilité de construire, à partir des éléments d'un 
espace 6 d'événements possibles, une multitude d’autres 
événements (grâce aux lois de composition) conduit les 
mathématiciens à associer à l’espace 6, supposé non vide, 
les espaces E, dits tribus de parties de &, tels que 


1) 6€E 
2)eeE=eeezE 
3) Si fex}r-1, nr € E, alors {es U 62. UexieE. 


Le couple {6, E} formé par l'ensemble 6 et une tribu 
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de parties de 6 est appelé un espace probabilisable. On 
réserve généralement le terme d'épreuve pour les événe- 
ments élémentaires de 6, tandis que le terme événement 
s'applique à tout élément e € E. {6} est l'événement certain, 
{2} (partie vide), en tant qu'élément de E, est l'événement 
impossible. 

Dans ce texte, toute application Pr : E — [0, 1] telle que 
Pr {6} — 1 et telle que pour tout couple exclusif e;, e€E 
(tel que e: Ne; — &), Pre; U e;} — Pr fe;} + Pr{e;} 
peut définir la probabilité Pr sur la tribu E (en mathé- 
matiques, par conséquent, la probabilité peut se définir 
en dehors de la restriction de l'hypothèse d'égale pro- 
babilité a priori pour les épreuves — ou événements élé- 
mentaires de 6). 


Variables aléatoires et distributions 
de probabilité 


Le concept de variable aléatoire 

Supposons que nous ayons un espace des événements 
possibles 6 et que nous décidions d'attribuer à une variable 
algébrique X la valeur x1 si le tirage au sort sur 6 réalise 
l'événement er, la valeur x2 si le tirage au sort réalise 
l'événement e, etc. Par exemple, 6 est l'espace des événe- 
ments possibles au jeu de roulette et X prend la valeur de 
la perte où du gain que nous réaliserons si la bille s'arrête 
sur telle ou telle case. 

On dit que X est une variable aléatoire. Dans ce cas, elle 
est attachée à l’espace des événements 6, ou, plus préci- 
sément, elle est définie par une application de l'espace 
des événements possibles sur le corps des réels : 


{en} = X= x» ER. 


Notons que cette application (définie a priori) peut 
être, ou non, biunivoque. Par exemple, pour le jeu de dés, 
on peut définir X comme la variable qui prend les valeurs 
1, 2, 6 quand le dé indique respectivement un 1, un 2 
ou un 6; mais X pourrait aussi être définie comme la 
variable, prenant la valeur 1 quel que soit le numéro 
indiqué sur le dé, excepté quand celui-ci est un 6, auquel 
cas X prend la valeur 2, etc. 

Une variable aléatoire X est discrète si les valeurs pos- 
sibles pour X = x1…, x» forment un ensemble de valeurs 
discrètes, ou continue si X peut prendre une valeur 
quelconque de l'intervalle [xa, x»] E R (c'est le cas, par 
exemple, de la variable aléatoire définie par les positions 
possibles d'une aiguille sur le cadran d'un appareil de 
mesure). 


Loi de probabilité se rapportant 
à une variable aléatoire discrète 


Définition 

L'union de tous les événements élémentaires auxquels 
est associée la même valeur x; de X définit un événement 
aléatoire a;. Par définition, la probabilité pour que X 
prenne la valeur x; est égale à la probabilité de réalisation 
de l'événement a;. 

Si l'application de & sur R est biunivoque, a; se réduit 
à un seul événement élémentaire e;, mais ceci n'est pas 
toujours le cas. Dans les deux exemples tirés du jeu de 
dés cités plus haut, la probabilité pour que X prenne la 
valeur 1, par exemple, est respectivement égale à la pro- 
babilité de réalisation des événements : 

— le dé indique un 1 (— 1/6); 
— le dé indique un chiffre quelconque à l'exception du 6 
(= 5/6). 

La probabilité pour que X prenne la valeur x; définit 
une application F (x;), que nous allons appeler /oi, ou 
en suivant un usage ancien quoique impropre, la distri- 
bution de probabilité de la variable aléatoire X. Cette 
application est limitée, puisque les probabilités vérifient la 
relation (2). Nous écrirons, en utilisant une notation 
évidente : 


( Pr (X = x) = F (x) 
(5) OL EF (M) ES 1 
ÜSF (x) =1 


où la dernière relation exprime le fait que la variable aléa- 
toire X prend nécessairement l'une quelconque des 
valeurs possibles x;. 


La distribution hypergéométrique 

Comme exemple d'une distribution de probabilité se 
rapportant à une variable discrète, nous prendrons la 
distribution hypergéométrique, liée au problème suivant : 
soit une population U de n objets. Supposons que nous 
choisissons au hasard 7 objets parmi cette population U. 
Le nombre de lots de r objets, sans distinguer leur ordre 
et sans prendre deux fois le même objet, qui puisse se faire 


à partir de | lation U est (?) LE 
à partir de la population U es le Fer 

Considérons maintenant chacun de ces lots comme un 
événement élémentaire d'un espace 6 des événements 
possibles, et supposons, en outre, que les 7 objets de la 
population U sont de deux types : m1 sont du type À, 
et les n — m restants du type B. Appelons K la variable 
aléatoire qui prend la valeur définie, à chaque tirage, par 
le nombre £ d'objets du type À présent dans le lot. Quelle 
est la distribution de probabilité F (k) se rapportant à K? 

Pour rendre notre discussion plus concrète, nous pou- 
vons supposer que U est une urne contenant m1 boules 
blanches et n — n1 boules noires. Nous tirons au hasard 
r boules hors de l’urne. F (k) représente dans ce cas la 
probabilité pour que le lot tiré contienne k boules blanches 
et r — k boules noires (fig. 4). 

La probabilité en question est, d'après (1). 


où N; est le nombre de lots de 7 boules contenant exacte- 
ment # boules blanches. On a (2) manières de choisir 
ces k boules blanches parmi les 71 boules blanches dis- 
ponibles. Chaque choix peut être combiné avec lé —# 
manières de choisir les r — k boules noires ; de sorte que : 


ni) ( = mn 
( k}\r—Kk 
7 
(7) 
Il est facile de démontrer, en se servant des définitions 
des coefficients binominaux, que F (k) peut aussi s'écrire: 


(x) Un: —#) 
a) 


La figure 5 représente la distribution F (K) dans le cas 
particulier r = 4, m — 5, n — 10. Dans cet exemple, 
k peut prendre seulement les valeurs : 0, 1, 2, 3 et 4. Les 
probabilités respectives sont : 5/210, 50/210, 100/210, 
50/210, 5/210. Il est clair que les relations (5) sont satis- 
faites dans ce cas particulier. Un calcul sans difficulté 
établit la généralité de ce résultat. 


(6) 


Fax) = 


Fo = 


Loi de probabilité pour une 
variable aléatoire continue 


Définition 

Soit X une variable aléatoire continue, définie sur l'inter- 
valle [Xu, Xo] — OÙ Xa < X». La probabilité pour que la 
variable X prenne une valeur quelconque de l'intervalle 
[X1, X2] définit une application F (x1, x2) ; les relations (5) 
généralisées s'écrivent dans ce cas: 
{ Pr (x1 < X < x2) = F (x1, x2) 
(7) 0 < F (x1,x2) < 1 

LÉ Ge de) =1 

On note que la fonction F (x1, x2) dépend des deux 
limites de l'intervalle. On introduit la densité de probabi- 
lité avec une seule variable définie par : 


d 
(8) di (Xe x), 
d'où : 


sb 
(9) F (xx) = | ŸF (x) dx 
CE 1 
1 
Si dx est un intervalle infinitésimal en x, les relations 


(7) s'écrivent, au vu de (9) : 


Pr(x<X<x+ dx) = f(x) dx 


” 
(10) 0<|"r0 dx<1 


1 


, 
re t 
J Ta 


La fonction F (xs, x) étant monotone et croissante 
dans l'intervalle (x4, x»), f (x) est définie positive par (8). 
Dans les relations ci-dessus nous supposons implici- 
tement x1 < xX2; dans le cas contraire, nous devrions 
prendre les valeurs absolues des intégrales. 

Les notions de distributions de probabilité F (X4, x) 
et de densité de probabilité f (x) se rapportant à une varia- 
ble aléatoire continue sont d'une importance fondamen- 
tale, en particulier pour la physique statistique. 


La distribution de Gauss 

C'est surtout l'immense champ d'applications de la dis- 
tribution de Gauss qui justifie la réflexion précédente. 
Celle-ci, qu'on appelle aussi distribution normale, est 


définie sur l'intervalle (— ©, + oo) par la densité 
associée : 
__ (x—xo)? 
(1) FO=NG—xo=- Te 
oV2rT 
F(k) fig. 5 
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A Figure 4 : 
Le problème de l'urne. 


<« Figure 8 : 

distribution F (k) 

dans le cas particulier 
r=4m=5,n = 10; 

k peut prendre seulement 
les valeurs 0, 7, 2, 3 et 4. 
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A Figure 6 : 

densité associée 

à la distribution normale, 
centrée et réduite. 


où cet xo sont deux paramètres, dont le premier est positif. 
Quand xo est nul, on dit que la distribution est centrée 
et quand 6 vaut 1, la distribution est réduite. On écrit 
d'habitude la distribution centrée et réduite de la façon 
suivante : 


(12) N&nD= Le 7-9 


= — 
[9 — 


\ 

Il est clair que le passage de (11) à (12) est toujours 
possible, moyennant un changement de variable aléatoire. 
La figure 6 représente la densité associée à la distribu- 
tion centrée et réduite. Diverses applications de la distri- 
bution de Gauss sont énumérées au long de ce chapitre. 


Loi de probabilité se rapportant à plusieurs 
variables 


Cas des variables discrètes 

Soit X une variable aléatoire susceptible de prendre les 
valeurs x1, …, x et Ÿ une autre variable aléatoire suscep- 
tible de prendre les valeurs y1, …, yn. À chaque événement 
élémentaire de l'espace des événements possibles sont 
alors associées non pas seulement une, mais deux valeurs 
(x, Ye), la première se rapportant à X et la seconde à Y. 
La probabilité de réalisation des événements correspon- 
dants définit une distribution de probabilité F (x;, yx) 
telle que : 


Pr(X= x; et Y=yxz) = F (x, yx) 


O< F (x, yx) <1 
F (x, Yx) = 1 
2 (X, Yx) 


en application des relations (5). 

Représentons par F1 (x;) la distribution de probabilité 
de la variable aléatoire X, et par F2 (yx) la distribution 
de probabilité de la variable aléatoire Y. Par définition 
F1 (x) est la probabilité pour X = x;, indépendamment de 
la valeur prise par Y. D'où : 


(13) Ex Go) æ 2 Ft vi 
De même : 
(14) É fi = 2 F (x ya). 


Les distributions F1 (x;), F2 (yx) sont parfois appelées 
distributions marginales de la distribution à deux dimen- 
sions F (x;,yx). Un cas particulièrement important est 
celui pour lequel nous avons : 
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(15) F (x, Ye) = F1 (x) Fa (ya). 


Il est facile de voir que dans ce cas les relations (13) et 
(14) sont automatiquement satisfaites, car 


ZA 9 = 28 (ya) = 1. 


Quand F (x;, yx) se met sous la forme (15), on dit que 
les variables X et Ÿ sont /ndépendantes. En comparant 
avec la relation (3), on voit qu'une définition équivalente 
de l'indépendance des variables X et Ÿ est : 


Pr (' | x] = Pr (M) 


Cas des variables continues 

L'application du raisonnement précédent — moyen- 
nant l'extension au cas de deux variables aléatoires des 
relations (10) — n'offre pas de difficultés particulières. 
On introduit alors la densité de probabilité f (x, y) pour 
deux variables aléatoires avec les propriétés : 


Pr(x<X<x—+ dx et y<Y<y—+ dy) —f(x,y) dx dy 


(16) 
et vice versa. 


FT F Vo 
0 < Ja 022 dx dy <1 


25 (U 
Es PAC "dy =1 
et: 


is, 
(17) fi Q = |, f@y) dy 


f ja 
20) = |, fe y) dx 


où f1 (x)1 et f2 (y) sont les densités de probabilité se 
rapportant à X et Y: on les appelle aussi densités margi- 
nales de f (x, y). 

De la même façon que précédemment, on dit que X et Y 
sont indépendantes quand: 


(18) f(x y) = h (fe (y) 


Moments d'une densité de probabilité 


Définitions 
Soit » un entier positif ou nul, 
— le moment d'ordre n de la densité de probabilité 
f (x) est défini par la somme : 


PT 
Men = |, xnf (x) dx 
J a 


— le moment d'ordre O est appelé norme de f (x) 
et vaut 1, par suite de (10) : 


Ho= [2500 = 1 


— le moment d'ordre 1 
mathématique de X 


M9) Ma 0 =E 00 = [Lx rx) dx 


est appelé l'espérance 


De façon plus générale, si y = y (x) est une fonction 
de x définissant une nouvelle variable aléatoire Y, l'es- 
pérance mathématique pour Y est: 


(20) EM = [2 y 69 #09 dx 


En effet, si fŸ (x) est la probabilité pour que 
xX<X< x + dx 


et F (y) est la probabilité pour que y < Ÿ < y + dy, 
nous avons : 


dé 
EM = Ye ON dv = 


[y CO 
v Va # 
Cette relation est immédiate quand y (x) est monotone; 


le lecteur peut vérifier qu'elle s'applique aussi en dehors 
de cette condition. On note que : 


dx 
dy 


2, 
dy= |,"y Cf dx 
J «a 


(21) AC = E (X?) 
— la variance relative à f (x) est par définition : 
(22) 2 = E[(X— <x))?] 


par suite de (20) 


(23) = [x GO F C9 dx 


Soit, en développant l'expression entre parenthèses : 
(24) oc = E (X2) —E (X}? 


Par suite de (23), o? ne peut être négatif, car l'intégrant 
comporte seulement des termes définis positifs. La racine 
positive de la variance, o, s'appelle l'écart type se rappor- 
tant à f (x). 

Toutes ces définitions s'appliquent, dûment modifiées, 
aux variables aléatoires discrètes. En particulier, l'espé- 


rance mathématique E (x) — À x; F (x) est la moyenne 
J 


des x; pondérés par F (x;) ; si les probabilités F (x;) sont 
toutes égales, E (X) est la moyenne arithmétique des x;; 
si X est définie comme prenant la valeur 0 quel que soit 
l'événement a;-£ a; et la valeur 1 pour l'événement a;, 
E (X) se réduit à la probabilité p; de l'événement a;. 


Fonction caractéristique 

La transformée de Fourier de la densité de probabilité 
F (x): 
ek)= | 


(25) F'eikz f (x) dx 


existe toujours, car f (x) est une fonction sommable. Elle 
est appelée fonction caractéristique associée à f (x), 
ou fonction génératrice des moments. Cette dernière 
dénomination provient du fait qu'en portant le dévelop- 
pement en série de Taylor de eî* autour de x = 0 
dans (25), on obtient : 


o (k) fl ikx Le ue xn + | f (X) dx 
; k2 (ik)? 
(26) AC 19161 7 A2 ST nr Jr TT 


Réciproquement, la connaissance de © (4) détermine la 
distribution f (x). La transformation inverse de (25) est: 


Fe-ikre (k) dk 


F (9) == | 


Nous avons alors cet important résultat : /a connais- 
sance de tous les moments d'une distribution de proba- 
bilité définit complètement cette distribution (puisqu'elle 
donne immédiatement la fonction caractéristique). 


La distribution G 

Appliquons les considérations précédentes à la distri- 
bution G définie sur (0, — 00) par la densité : 
(27) G (x, 8, x) — Ax%eÊêT 


où x et 5 sont deux paramètres réels positifs et À est la 
constante de normalisation : 
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Bx +1 


(28) SE TT 


où L'(x + 1) = Fe y*e-Ydy (= 1<x< 00) 
Jo 


Pour trouver la fonction caractéristique de cette dis- 
tribution, démontrons le lemme suivant. 


Lemme : Vs réel > O et VS (Re 8 > O), 


f oo à T(x—1 
y (8) = |" xte-frax = Ier 
Jo Ba +1 
Pour 8 réel, cette relation est la conséquence immédiate 
du changement de variable y — 8x. 


Pour 8 complexe, on a, en posant z = 8x 


Ge 


Qy — 
ï Ba +1 


rB 
| z*e-:dz (fig. 7) 
ÿ À 


La fonction f (z) — ze, x > 0 n’a pas de pôles dans la 
région Re z > 0. En sommant sur le contour ABCA : 


éreade= [rt [fra d2+ [re d2= 0. 
d J A JB J'C 


Quand le rayon du cercle BC tend vers l'infini, f (z) tend 
vers 0 sur tous les points du parcours. Par suite : 


à Le 
| f(2)d2= | f(2)d2= |" zetdz=T («+1) 
A J A J0 


Û 


La fonction caractéristique associée à (27) est donc : 
P co …... [el æ +1 
o (k) = A | xte— (B—ibrgx — L—;] 
Jo 8 — ik 


Les premiers moments de la distribution G (x, 8, x) 
sont, en application de (26) : 


ACo = © (0) = 1 
Ma =—ig (0) = ET 


e 
D 


(29) i 
(« + 1) 


(œ + 2) 


AC: = — 9” (0) = 


es 


Il est facile de vérifier que ces valeurs coïncident avec 
rx 
la définition des moments { AC, — | x f (x) dx). 
Ja 


On note que, pour la distribution G, E (X) ne coïncide pas 
avec la va/eur plus probable de x (définie par f” (x) = O0), 
soit x — _ 

La figure 8 représente les distributions G (1,1, x) et 
G (5, 1,.x). 


La distribution de Dirac - Applications 


Définition 
Considérons la « déformation » subie par la densité 
normale (11) quand, xo étant fixé, on fait diminuer la 


valeur de 6. La valeur centrale N (0, 5) — aug- 


5 
6cV2T 
mente, tandis que la courbe se rétrécit autour de la valeur 
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« À gauche, figure 7 : 
voir développement 
dans le texte ci-dessus. 
A droite, figure 8 : 
distributions G (1, 1, x) 
et G (5, 1, x). 


» Figure 9: 

pour 5 très petit, 

la densité normale 
demeure presque nulle 
en tout point, 

sauf au voisinage 

de xo, où elle prend 

des valeurs très grandes. 


Richard Colin 


x = xo, de telle sorte que la condition de normalisation 
PT P+ oo 
reste vérifiée : Vo > O, | N (x— xo, os) dx = 1.Pours 


d — © 
très petit, la distribution demeure presque nulle en tout 
point, sauf au voisinage de xo, où elle prend des valeurs 
très grandes (fig. 9). Considérons maintenant une somme 


du type : J — F à y (x) N (x — xo, 5) dx où y (x) est 


— 
une fonction « suffisamment » régulière en xo. Il est clair 
que, à mesure que o diminue, l'expression au-dessous du 
signe somme ne prend de valeurs non négligeables qu'au 
voisinage immédiat de x — xo. Dans ce voisinage, y (x) 
reste voisin de la valeur y (xo), de sorte que : 


: P+ 00 
lim J = y (xo) | N (X— xo, 5) dx = y (Xxo). 
c—>0 v- 0 
Nous définirons /a densité à de Dirac à travers la pro- 
priété fondamentale suivante : y (x) étant une fonction 
bien définie en xo, 


(0) | y (9 3 (x— x0) dx = y Go). 


Cette densité peut être représentée symboliquement par: 


à (x— xo) = lim N (x— xo, 5). 
CES 


Cette représentation de la distribution à est trop étroite 
pour couvrir toute la généralité de la propriété (30), pour 
laquelle nous n'avons imposé aucune condition de régu- 
larité sur la fonction y (x) ; par suite, elle ne constitue pas 
une définition de la densité. Elle suffit cependant dans les 
applications pratiques que nous ferons. 


Propriétés de la densité à 
à (x — xo) étant nulle, quel que soit x £ xo, la propriété 
fondamentale (30) peut aussi s'écrire : 


{ y Co) 
JE |O 
En effectuant un changement de variable convenable 
dans la relation ci-dessus, le lecteur vérifiera que, si g (x) 


est une fonction nulle aux points x; (/= 1,n) et telle 
que Vig’ (x) Æ 0, on a: 


5 (a @)=2: 


si xo € ]x1, xo[ 
si xo € [x1, x2] 


Fo 


y (x) à (x — xo) dx = 
TL 


1 
g' (x)| 


(31) à (x — xi) 


Application aux fonctions de variables aléatoires 

Soit Y — g (X) une fonction de la variable aléatoire X 
définie sur l'intervalle [x4, x5] et régie par la densité de 
probabilité f (x). La densité de probabilité F (y) relative à Y 
est donnée par la relation : 
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G2) FN = [200 5 (7—9 0) 


En effet, les moments de la distribution F (y), qui, comme 


nous l'avons vu, définissent complètement cette distri- 
bution, sont : 


Py 
Mn = |," y" F (y) dy 
+ a 


LE 
“ Va . Ta 


ya f(x) 3 (y — g (x)) dxdy 


= [2 Le CO r 69 dx 


ce qui concorde bien avec (20) et (21). 

La relation (32) s'étend immédiatement au cas d'une 
variable aléatoire Y fonction de différentes variables aléa- 
toires X1, Xo, …, Xn; si f (x1, X2, …, Xn) est la densité de 
probabilité (à n dimensions) relative à X1…., X, et si Y 
est définie par la fonction YŸ — g (x1, x2, …, Xn), On a : 


(33) F0) = | FO 2... #0) 
S (y — g (X1, X2, …, Xn)) dx1dx2 … dXn 
Somme de variables aléatoires 
Les sommes de variables aléatoires vérifient les pro- 


priétés fondamentales suivantes : 
— Espérance mathématique 


SiY = X1 — Xo — … — X», alors 
(34) E(Y)=E (X) + E (X2) + … + E (X2) 
— Variance 
Si Y — X1 + Xo + … + X, et si les variables X1, X2, … Xn 
sont indépendantes, alors 
(35) y = Om + Or Fee + OEn 


Les relations (34) et (35) sont simplement des appli- 
cations des définitions (19) et (23) surla distribution (33), 
avec g (x1, X2, …, Xn) = X1 + X2.…. + Xn 
[quand X1, X2, …, XA sont indépendantes, f (x1, x2, …., Xn) 
est de la forme f1 (x1) fa (X2) … fn (Xn) — voir (18)]. 


La distribution binominale 
et ses approximations 


La distribution binominale 


La distribution binominale se rapporte aux problèmes 
très généraux d'épreuves répétées (simultanément ou 
successivement) sur une même variable aléatoire X, régie, 
à chaque tirage, par la même loi de probabilité f (x). 


Définition 

Soit 6 un espace d'événements possibles, À un événe- 
ment € 6. Dans un essai isolé, À a la probabilité p de 
se produire. La distribution binominale donne la probabi- 
lité d'obtenir k épreuves favorables, c'est-à-dire, donnant A 
pour résultat, quand l'épreuve est répétée n fois. 

Pour chaque essai, nous avons deux résultats possibles : 
ou À se produit (probabilité p), ou À, l'événement com- 
plémentaire, se produit (probabilité g — 1 —p). Consi- 
dérons une séquence quelconque de 7 événements; par 
exemple, la séquence S = À, À, À, À, À, etc. dans 
laquelle l'événement A se produit £ fois. Cette séquence 
a pour probabilité : 

Pr(S)=Pr{ANANAN ANA} 

= pgpggq …. = péqn—Ë 
d'après (3) et (16). En effet, c'est la probabilité de l'évé- 
nement composé « À se produit dans le premier essai 
et À dans le second, etc. », compte tenu du fait que les 
événements successifs sont indépendants. 

Le nombre de séquences telles que S, contenant exac- 
tement £ fois À, est (7) 
ces séquences exclut celle des autres, de sorte que la 
probabilité pour que l’une ou l’autre de ces séquences se 
produise est : 


. La réalisation de chacune de 


(36) P (k) = (6) prqn=# 


en application de (4). . 
Exemple. Dans le jeu de pile ou face, la probabilité de 


« pile » est : La probabilité d'obtenir 4 fois « pile » dans 


dans une partie de 5 essais est: 


5\ ./ TN 
P (4) = fi () = 0,152. 

On note que la distribution (36) est différente de la 
distribution hypergéométrique (6). Dans l'exemple du 
tirage de boules dans une urne, la distribution (6) se 
rapporte au tirage successif de r boules dans une même 
urne (de sorte que la probabilité d'obtenir une boule 
blanche varie d’un tirage à l’autre). Au contraire, la dis- 
tribution (36) se rapporte au tirage de r boules dans n urnes 
identiques, où encore au tirage de 7 boules dans une 
urne, à condition que l’on recompose l'urne initiale après 
chaque tirage. 


Moments | 
Les moments de la distribution (36) se déduisent de la 
loi du binôme de Newton : 


n 

> (1) ani pi— (a + bjr 
i=0 

qui donne immédiatement 


n 


ACo — > (2) prgr 8 = (p + gr = 1. 


Le calcul des moments d'ordre supérieur s'effectue de 
même, en posant 4’ — k— 1. On trouve : 


Eh = 
(87) di té ... 


Distribution de Poisson 


Définition; moments 

La distribution de Poisson est une approximation de la 
distribution binominale, valable quand la probabilité p 
est très petite et le nombre de tirages n très grand, de sorte 
que le nombre de cas favorables (< np) reste de l'ordre 
de quelques unités. 

Posons À = np:ona: 


: nl 1 AU A? 
=. kgr-k a = nk [= = 

Fe area te (à) (2 

puisque n À k. Pour n très grand, nous avons : 


Log (1 à" — n Log (1 —i 


et 


K! 


Cette relation définit la distribution de Poisson. 
Les moments correspondants se calculent aisément, 


21% 


Le 
2 À ; 
compte tenu de la relation b> Tr = e*. On trouve : 
k=0"" 


ALo = 1 
E (9 = 2 
at = à. 


Exemple d'application : substances radio-actives 

Un exemple courant de l'application de l'approximation 
de Poisson est la désintégration d'une substance radio- 
active de grande durée de vie +. Un échantillon d'une telle 
substance est composé d'un nombre très grand: n + 1023 
atomes, chacun d'eux ayant une probabilité très petite de se 
désintégrer pendant la durée de l'observation At < =. 

Ainsi, le nombre moyen de désintégrations observées 
dans un microgramme de Ra226 (+= 5:1010s) à travers 
un angle solide de 0,002 4 sr en une seconde, est 


\ = np © 10. 


La figure 10 représente la distribution de probabilité 
d'observer k désintégrations en une seconde. On note 
que si la probabilité p n'était pas aussi petite (durée de vie 
du même ordre de grandeur que le temps de mesure et 
grand angle solide), l'approximation de Poisson devien- 
drait injustifiée dans cette application. 


Distribution de Gauss 


La distribution de Gauss ou normale définie en (11) 
constitue une autre approximation de la distribution 
binominale (36) dans Ja limite où n — 0, p et q restant 
fixés. Dans cette limite, le nombre de succès + np — © 
avec n, de même que le nombre de cas défavorables 
+ ng. On a: 


P (k) = TE SE 
KI (n—#)i 
(38) ne N (K— np, Vnpq) 


En effet, quand n > 1,P (Kk) ne prend de valeurs appré- 
ciables que dans le voisinage de E (k) — np, et les 
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À Surface de Gauss. 


Y Figure 10 : 
distribution 

en une seconde, 
Kk désintégrations 
d'une substance 
radio-active 


subissant en moyenne 


10 désintégrations 
par seconde. 
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» Figure 11 : 

voir développement 
dans le texte 
ci-contre. 


factorielles en n, k et n— k tendent vers la fonction 
de Stirling : 


—— /7\? 
[= V2 7z [= 
rer È) 
Utilisant cette expression pour les factorielles présentes 
dans (38) : 
În np\é/ n n—k 
P (> (E) | ) 
\27k (n—k)\ NN — 
Posant £ — k— np 
P (D æ- se = 
27 (np + £) (ng— Ë) 
np np+E ( ng | ng —E 
he + £ nq — Ë 
no vn 
V2 (np + €) (ng —E) 


np 
+ (ng— 2 Log (1— À) 


Pour £ € np et £ < ngq, on obtient, en développant les 
logarithmes et en ne retenant que les termes dominants : 
1 2 

PK) = -—> exp — — 


—_— = N (k— np, \npq 
ae Dune ( P, \npq) 


Moments 
Les moments de la distribution normale sont : 
a &. œ Pa - ae À ma 2 
Jen (E) = |" EN (E Vnpg) dé, E=k— np 
v — © 


: a : T 
En se servant de l'intégrale définie | e- dt — 7 eten 
Jo 


intégrant par parties, on obtient pour les premiers moments: 


ACo = 1 
E (k) = np 
o? (K) — npq 


Ces relations sont identiques aux relations (37) indi- 
quant que les trois premiers moments de la distribution de 


Gauss N (k— np, {npq) coïncident avec les moments 
de la distribution binominale. La comparaison des deux 
distributions montre que l'approximation gaussienne est 
satisfaisante dans les applications pratiques, dès que 
n > 10 (fig. 10). 


Fonction caractéristique 
La fonction caractéristique (25) de la distribution 


normale © (k) = | 7 eikz N (x— xo, 5) dx 


+ — 


1 [ D 


(39) ® (k) = —— etre 67 F7 #0?/20 dx 


[27 J- 


peut se calculer en utilisant le lemme suivant. 


Im (@) 


fig. 11 


| 
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Lemme 
Pr. —2224 
J (x, 8) — | e 7 28 Ux, B réel ou complexe 
J - wo 
Fr 
(40) = NT e8/ 
œ 
En effet 
Fs p\2 
e ss FES = À 
J (x, 8) = ef# | e (ex :) dx 
CEE : © 


8 
Posant z — 4x ——. 
œ 
2 1 21,2 °B 2 D 
J (x, 8) = - esta | e- À? dz (fig. 11) 
œ J A 
La fonction f (z) — e-2? n'a pas de pôles dans le plan 
complexe. Intégrant sur le contour ABCD : 


ér(adz= (r() de [°F(2) de 
d J A B: 


D A 
+ (rt ds [95 de= 0 
Je JD 
Quand les côtés BC et AD tendent vers l'infini, f (z) tend 
vers O0 sur tous les points des parcours correspondants. 
D'où : 


°B PC P+ co . 3 
|, de = |, f@ dz = | e-2 dz, zréel = x, 


ce qui complète la démonstration. 
Combinant (39) et (40), on obtient : 


— ko? +ikx 
p(K)=e — 0 


Lois des grands nombres 


Les lois des grands nombres constituent le noyau de la 
théorie des probabilités. La première loi, en particulier, 
assure que la fréquence des événements favorables tend 
bien vers la probabilité, quand celle-ci existe, conformé- 
ment à la supposition de base de notre exposé. La seconde 
loi, d'un autre côté, indique que la distribution de pro- 
babilité d'une somme de variables aléatoires tend, pres- 
que toujours, vers une distribution normale, à mesure que 
le nombre de variables de la somme augmente. Comme, 
dans les cas usuels, la convergence de la distribution 
vers une distribution normale est très rapide, cette loi 
permet de comprendre la grande portée de la distribution 
normale. 

Les deux lois des grands nombres peuvent se présenter 
sous diverses formes, suivant le degré de généralité 
exigé. Les difficultés des démonstrations augmentent 
malheureusement avec ce degré de généralité. Pour cette 
raison, nous nous contenterons d'énoncer ces théorèmes, 
laissant aux lecteurs intéressés la liberté de chercher 
dans les livres spécialisés les détails des démonstrations. 
Les discussions de ces détails appartiennent aux théories 
mathématiques des probabilités. 


Première loi 

Soit {Xx} une séquence de variables aléatoires indé- 
pendantes, chacune d'elles régie par la même distribu- 
tion de probabilité. Si l'espérance mathématique E (X) = 
existe, alors, nous avons pour tout £ > 0 


V2 
| = 8 


On notera qu'il n'est pas nécessaire que les autres 
moments de la distribution de probabilité, et en parti- 
culier ©, existent (c'est-à-dire soient finis). 

La première loi des grands nombres peut s'appliquer 
aussi quand les variables aléatoires X1, X2, …, XA ne suivent 
pas la même distribution de probabilité. Dans ce cas, 
toutefois, les diverses distributions doivent remplir cer- 
taines conditions supplémentaires. Le théorème s'applique, 
en particulier, si l’une des deux conditions suivantes au 
moins est satisfaite : 

a - toutes les variables X; sont limitées, c'est-à- 
dire 3 un nombre A tel que Vi Xi] < A; 
b - les variances existent, et S? étant la variance de 


:. 5 
la somme (S2=— X dire — 0 quand n — co. 


L'espérance mathématique de la somme étant donnée 
par (34), la limite u sera dans ce cas la moyenne arith- 
métique des espérances mathématiques respectives : 


{ si 
n 


Appliquons maintenant la première loi des grands nom- 
bres aux variables aléatoires X; qui prennent les valeurs 
1 où 0 selon que le résultat du /-ième essai d'une séquence 
d'épreuves répétées est favorable ou non. Ÿ = Z X; est 
le nombre d'événements favorables obtenus au total, et 


f= E & la fréquence. Par ailleurs, 


E (X)=0(1—p)+1(p)=2p 
est la probabilité de succès pour n'importe quel essai. 
La première loi assure donc que la fréquence tend vers 
la probabilité, quand le nombre d'épreuves tend vers 
l'infini. 


Deuxième loi (Théorème de la limite centrale) 

Soit {Xr} une séquence de variables aléatoires indé- 
pendantes, chacune d'elles régie par la même distribu- 
tion de probabilité. Si l'espérance mathématique E (X) = 4. 
et la variance E (X2) — E (X)2 = 0? existent, alors pour 
tout couple «, B (x < 8): 


X1 + … Xn — nu 


<pl=® (8) —® (a) 


lim Prix < — 
n + SG Vn J 
où 
1 fi 2 
(o) (x) = — | e t*/2 dt 
2 7 J -« 


Pour montrer plus clairement que ce théorème implique 
que la distribution de la somme Ÿ = X X; tend vers une 
distribution normale, posons : 


… (Y — YŸ) 


= 


T a=t B=t+dt 


c\n 
nous obtenons : 
Prit<T<t+dt}=N(t1) 
D'où, en se servant de (32) : 
F(N=[ÎN(E1) 5 (y—to \n— <yÿ) dt 
FM=N(y—<y}, 5 \n) 


Comme la première loi, la seconde loi des grands 
nombres peut s'étendre au cas où les variables aléatoires 
X1, …, Xn ne suivent pas la même distribution de probabi- 
lité, pourvu que les diverses distributions satisfassent 
certaines conditions générales. Elle s'applique en par- 
ticulier quand la condition a définie plus haut est satis- 
faite et que l'écart type correspondant à la somme, 
soit Sx, tend vers l'infini quand n — ©. 

Si X; prend la valeur 1 où O selon que le résultat du 
i-ième essai d'une séquence d'épreuves répétées est 
favorable ou non, nous obtenons le résultat suivant : 
la limite, pour n — ©, de la distribution binominale est 
une distribution normale. Dans ce cas, la seconde loi 
implique aussi que la fréquence doit tendre vers la pro- 
babilité. En effet, à mesure que n augmente, la variance 


dé 5) 46 — Re 
de la fréquence — soit — — diminue, la distribution se 
\n 
rétrécit autour de l'espérance mathématique, qui est, dans 
ce cas, la probabilité elle-même. 


Corrélations 


Par définition, deux événements aléatoires À et B sont 
dits /ndépendants si la réalisation de l'un quelconque 
d'entre eux n'influe pas sur la réalisation de l'autre. La 
probabilité de la réalisation de l'événement composé 
A NB (A et B) est alors simplement le produit des pro- 
babilités de réalisation de chacun d'eux. 

Si X et Ÿ sont deux variables aléatoires indépendantes 
etf1 (x) etf2 (y) sont les densités de probabilité associées, 
la densité de probabilité associée à X NN) Y est 


FX y) = À (9 fe (y). (18) 


Deux événements aléatoires tels que la réalisation de 
l'un d'eux modifie les probabilités de réalisation de 
l'autre sont dits //és. La probabilité de réalisation de l'évé- 
nement composé A f B est donnée par (3). La densité 
de probabilité associée à deux variables aléatoires X et Y 
liées ne prend pas la forme simple (18). 

On dit aussi, souvent, que les variables X et Y sont 
corrélées. || faut toutefois utiliser ce terme avec prudence, 
car, comme on le verra, on introduit un coefficient de 
corrélation entre X et Ÿ qui peut être nul, même pour deux 
variables liées. 


Courbes de régression 

Considérons la densité de probabilité à deux dimensions 
f (x, y) et portons-la sur un diagramme à deux dimen- 
sions (x, y), par exemple sous la forme de courbes de 
niveau (fig. 12). La densité de probabilité associée à Y, 
pour x fixé, est proportionnelle à f (x, y) : 


(41) gM=fœr) IÎF (x y) dy 


=+ 


Si X et Y sont deux variables indépendantes, cette 
densité est : 
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A Figure 12: 
quatre exemples 

de densités de probabilité 
à deux dimensions 
pour deux variables 
aléatoires X et Y 
diversement liées : 
a, X et Y sont 
indépendantes ; 

b, elles sont liées, 
bien que la droite 


de régression Yx 

soit parallèle 

à l'axe des x; 

c, cas général; 

d, cas des deux variables 
liées par la relation 
Y=Y(X). 
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g (9) = ñh (9 Re ( / 4 (9 Î (9) dy = f (y). 


Elle reste constamment égale à la distribution marginale 
f2 (y). En langage imagé, on dira que n'importe quelle 
coupe effectuée à x = cte reproduit la distribution mar- 
ginale associée à y. Le fait que les distributions obtenues 
à x = cte reproduisent toutes la distribution marginale 
ne fait que traduire directement l'indépendance mutuelle 
de X et Y. 

Cette propriété n'est évidemment plus vraie dans le 
cas de deux variables aléatoires liées. Considérons la 
valeur moyenne z de la distribution (41). z est la valeur 
moyenne des résultats y que l'on peut obtenir sachant que 
l'on a obtenu X = x. Par définition de la moyenne (19) : 


z= | ya (y) dy = [yf(x y) dy / [f(x y) dy 


La courbe décrite par z quand on fait varier x tout au 
long de l'intervalle (x4, xs) de définition de X s'appelle 
la courbe de régression de Ÿ en X. 

On peut définir de la même manière la courbe de régres- 
sion de X en Ÿ, définie par l'espérance mathématique de X 
obtenue à y fixé, quand y varie tout au long de l'inter- 
valle (Ya, y») de définition de Y. 

Il est évident que, dans le cas où X et Ÿ sont indépen- 
dantes, les courbes de régression de Ÿ en X et de X en Y 
sont des droites parallèles, respectivement à l'axe des x 
et à l'axe des y. Cependant, le fait que les courbes de 
régression soient des droites parallèles aux axes n'est 
pas une condition suffisante pour que X et Ÿ soient indé- 
pendantes. En effet, non seulement le moment d'ordre 1, 
(l'espérance mathématique), mais la distribution de pro- 
babilité elle-même de Y à x fixé (ou de X à y fixé) ne 
doit pas dépendre de x (ou de y). Par exemple, sur la 
figure 12 b), la courbe de régression z = © (x) est paral- 
lèle à l'axe des x, mais les variables X et Ÿ ne sont mani- 
festement pas indépendantes. 

Un cas extrême de liaison entre X et Ÿ est le cas où 
Y est une fonction univoque de X : Y — Y (X). Dans ce 
cas, on dit que Ÿ est strictement liée à X. La densité 
f (x, y) est nulle partout, sauf aux points y — y (x). La 
courbe de régression z = © (x) se confond avec cette 
fonction, et les distributions de probabilité à x fixé sont 
les distributions à de Dirac : il n‘Y a aucune disper- 
sion possible des résultats de tirage de YŸ à x fixé. En 
particulier, la variance ( associée à la distribution (41) 
est nulle. 


Coefficient de corrélation de Pearson 

La variance 62, de la distribution de Y pour x fixé donne 
donc une idée de l'intensité avec laquelle les variables X 
et Ÿ sont liées. La valeur moyenne de cette grandeur 
(42) s, _ Je, f1 (x) dx 
est reliée au coefficient de corrélation de Pearson nx/x 
par la relation : 
(43) 1 


FIX 


2 


2 2 
= 1 — 5/5, 


2 . . . . : 
où 5, est la variance de la distribution marginale f2 (y). 
2 . z ar 2 
Tux est toujours compris entre O et 1. Il est nul si = 0, 
ou z = cte. La courbe de régression de Y en X est alors 
une droite parallèle à l'axe des x, ce qui n'implique pas 
nécessairement que X et Ÿ soient indépendantes. || est 
égal à 1 quand Y est une fonction univoque de X (s, = 0). 
L'équation (43) ne définit pas le signe du coefficient 
de corrélation de Pearson 5x. Siz = © (x) est une fonc- 
tion monotone, on choisit le signe de dérivée de cette 
fonction (xx positif si un accroissement de x favorise 
un accroissement de y, et négatif dans le cas contraire). 


Coefficient de corrélation 9 

Malgré ses avantages, le coefficient de corrélation 
de Pearson n'est pas la seule mesure possible du degré 
de liaison entre deux variables aléatoires. On utilise plus 
fréquemment encore le coefficient #, défini par : 


RER) (re C0 
GX 6Y | 
qui est le rapport de l'espérance mathématique du produit 


des variables centrées au produit des variances corres- 
pondantes. £ peut encore s'écrire : 


(44) 


© — 
i 
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: OX CY 
Il est, en valeur absolue, inférieur ou égal à 1. En effet, 


si nous appelons Æ et H les variables centrées corres- 
pondant à X et Y prenant les valeurs £ et.n respective- 


ment, 
(En)? 
Ke?» €?» 
d'après (44) et (23). 
D'autre part, quel que soit », l'expression (2£ — n}2 

est > 0. Par suite : 

LOE— n}> > 0 

A2 ED — 22 <En> + <n> > O0 Vi; 


le discriminant réduit de cette expression, 


CEnd? — (EE) Cry, 
est donc toujours négatif ou nul (inégalité de Schwartz). 
Comparant avec (46) : 
(47) p2< 1 
La valeur extrême de +, |e| = 1, est obtenue pour 
X— £X9 = a (Y — £Y}), c'est-à-dire quand il existe une 
dépendance linéaire entre les deux variables. 


; Le coefficient de corrélation de deux variables aléatoires 
indépendantes est nul; écrivant 9 conformément à (45), 


on a, dans ce cas : (xyÿ = Î Xyf1 (x) F2 (y) dxdy 
= [rfi C9 dxf y Re (1) dy = D 


A l'opposé, le fait que : = 0 ne prouve pas que X et Ÿ 
soient indépendantes. 


(45) 


(46) fie 


Loi normale à deux variables 


Un cas particulièrement important de distribution à 
deux dimensions est le cas où la densité de probabilité 
de Y, à x fixé, est normale [c'est-à-dire est donnée 
par (11)], de même que la loi de probabilité de X à y fixé. 

La densité à deux dimensions f (x, y) centrée, définie 
pour x et y € (— co, + wo), peut alors se mettre sous la 
forme : 

AS [ 1 
(48) f(x y) = 2 P |—5 (ax? — 2 bxy + cy?) 
où à — ac — p?. 
La densité marginale de x est : 


NS ai + oo 1 
A (x) = 3e ? | exp — 3 (— 2 bxy + cy?) dy. 


27 JE 


Le changement de variable { = y — xb/c donne : 


h D =N (x NE 


De même, la densité marginale de y est : 


(49) 


(50) RD =N (4/5). 


è 
En utilisant les mêmes notations, la densité de proba- 


bilité g (y) de la variable Y à x fixé est : 
+ 


xb 1 
51 n=N(r—-2—);: 
BU GONE 
tandis que la densité de probabilité h (x) de la variable Y 
Y = y 
à y fixé est : 
/ b 1 
(52) h C9 = N(x—X =) 
Y=y \ a Va 


La densité (48) a donc la propriété remarquable sui- 
vante : aussi bien les densités conditionnelles g (y) et 
h (x) que les densités marginales f1 (x) et f2 (y) sont 
normales (mais avec des largeurs différentes). 

Les équations (51), (52) montrent en outre que les 
courbes de régression sont des droites passant par l'ori- 


b 
gine. La droite de régression de Ÿ en X a pour pente = 


a 
et celle de X en Ÿ a pour pente B' 


Corrélation | 
La valeur moyenne du produit XY est : 


<xy> = Îl xy f(x, y) dx dy 


ax? 


: ar? ; 1 
3—= | xe ? dx | y exp — > (cy?— 2 bxy) dy 


| xb 
En utilisant le changement de variable t = y 7 eten 


intégrant par parties l'intégrale sur y, puis celle sur x, on 
trouve : 


(53) <xy> = 


b 
è 
d'où : 


ac 
où nous avons utilisé (45), (49) et (50). 
Le coefficient de corrélation de Pearson est donné par 
(43) : 


2 di 718 
Tyrx fes nl 5% 
Ré M 2 à . 
où 6 —- et o.—- par (42), (52) et (50) : 
D "© x ù 
2 b? 
nn... = —= p?. 
Y/X ac L 
5 2 
On trouverait de même : 7... — = 9, 
X/ ac 


Pour la distribution normale à deux dimensions, les 
coefficients de corrélations de Pearson et le coefficient £ 
prennent la même valeur absolue. La convention de signe 
donnée plus haut pour le coefficient 1x assure qu'ils 
ont également le même signe. 

Réécrivons la distribution (48) en fonction des para- 
mètres p, ox et 6x. 

On trouve : 


1 
OT Er: 

EUR ee 7 | 

oi à TE le dr ce) 


Fonction caractéristique _ 
La fonction caractéristique de la distribution (48) : 


o (u, v) | | Feitur+ eu) f (x, y) dx dy 
« Le) 


se calcule aisément en utilisantle lemme (40). On obtient: 
L (cu? +2 bur + av?) 
o (u,v) = eè 
Il est remarquable que cette relation peut encore s'écrire, 
en utilisant (49), (50) et (53) : 
(55) ® (u, v) 


= exp _ (x29 u? + 2 xy> uv + <y?} v?) 


Notons enfin que la fonction caractéristique o1 (u) 
associée à la densité marginale f1 (x) est, par défini- 
tion (17) de celle-ci: 

(56) œ1 (u) = | et dx | f(x y) dy = & (u. 0). 


Distribution de deux variables gaussiennes 
indépendantes 

Pour po — 0 (ou b= 0), la densité 
simplement : 


(54) devient 


x2 


(57) 


F (x y) 


1 1 ( 


exp - 
27 oxoy 2 \o$ 


= N (x 6x) X N (y, ox). 


Par conséquent, f (x, y) est dans ce cas la densité 
de probabilité correspondant à deux variables gaussiennes 
X et Y indépendantes. Nous avons donc l'importante 
propriété suivante : pour un couple de variables gaus- 
siennes, la nullité du coefficient de corrélation est équi- 
valente à l'indépendance de ces variables. 

La figure 13 présente, en perspective, la densité de 
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fig. 13 


a 


distribution pour deux variables indépendantes normales, 
centrées et réduites (ox — ox — 1). 


Réduction en facteurs 
La transformation linéaire X’ — 4X + 8 laisse invariant 
le coefficient de corrélation +. En effet, 


XV) = 2 END + 8 €YD, XD CD 
= RO KV} + BY? 

Par contre, la transformation plus générale : 

[ X'= aX + £Y 

Ù Y'= «XX + BY 


et x — 4x. 


I 


(58) 


modifie le coefficient de corrélation. Si nous supposons 
pour simplifier que X et Ÿ sont des variables indépendantes, 
centrées et réduites, c'est-à-dire telles que £X> — £Y> = 0, 
£X?5 = £Y?5 — 1, on obtient : 


EXYD> = 04° + 
2 


(59) = mé 
=? 8? 
D'où : 
Sd au + 8£ 
d Var + 82 Jar + pr 


Bien entendu, la transformation inverse est possible. 
Partant de deux variables X’ et Ÿ’ normales et centrées 
(ce qui est toujours possible moyennant un changement 
de variable trivial), d'écarts quadratiques 64 et 64 et de 
corrélation £’, on peut trouver (d'une infinité de manières) 
des nombres &, 8, x’, 8’ vérifiant (59). 

La transformation inverse de (58) : 

LX = (BX'— BY’) (28° — 8 
(60) [X = (EX — BV) GE — 8) 
UY= (—%X + aY’) (48° — %8) 
définit deux variables aléatoires X et Ÿ indépendantes, 
normales, centrées et réduites, dont la densité de pro- 
babilité : 

FXY=N(GTN(1,) 


est celle qui est représentée sur la figure 13. 

Cette transformation s'appelle la réduction en facteurs 
des variables aléatoires gaussiennes X et Ÿ. En statistique, 
il est extrêmement important, à partir d'un ensemble de 
variables aléatoires gaussiennes corrélées deux à deux, 
d'obtenir un ensemble en nombre égal (ou inférieur, si 
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À Figure 13 : 
représentation, 

en perspective, 

de la densité 

de distribution pour 
deux variables 
indépendantes normales, 
centrées et réduites 

(ox =6y=71). 
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A Figure 14: 

un exemple 

de processus markovien : 
les déplacements 
aléatoires d'une particule 
sous l'effet des chocs 
aléatoires des molécules 
d'un liquide. 


certaines des variables définies ne sont pas linéairement 
indépendantes) de variables gaussiennes indépendantes, 
qui sont évidemment plus aptes à caractériser le problème 
statistique posé. Cette recherche générale des facteurs 
constitue alors l'analyse factorielle (voir Analyse des 
données). 


Variables gaussiennes à N dimensions 


La forme des équations (55) et (58) suggère l'avantage 
qu'il y a, lorsqu'on traite le problème de variables gaus- 
siennes corrélées, de traiter l'ensemble des variables 
aléatoires sous forme matricielle. La généralisation des 
résultats obtenus dans le cas de deux variables s'exprime 
alors ainsi : 


a - Généralisation de (55). 


|t 
Soit { — le le vecteur formé par les variables #1, …, êx 
[S 
associées dans la transformation de Fourier aux variables 
aléatoires X — | X1| 
xx 


La fonction caractéristique associée à la densité de 
probabilités de N variables gaussiennes centrées est : 


op ()=e 


où T symbolise la transposition et où V est la matrice des 
variances de dimension N x N. 


LED (GX) … XX) 
LR) LE) … (XX) 
CAXS) LGXS) CE) 
Nous dirons que les variables aléatoires X suivent 
une distribution normale centrée N (X, V). 
b - Généralisation de (56). 


(61) V= 


Xi | 

Chaque sous-ensemble Y — | à p dimensions 
Xx | 

(p < N) de X suit une loi N (Y, W), où la matrice des 

variances W est formée à partir de la matrice V en ne 

retenant que les lignes et les colonnes correspondant à 

(X:, …, Xx). En d'autres termes, les lois marginales à 


p dimensions sont normales. 


c - Généralisation de (57). 

Séparons les X variables en deux sous-ensembles Y 
et Z de dimensions p et q respectivement. Une condition 
nécessaire et suffisante pour que Ÿ et Z soient indépen- 
dantes est que E (YZT) — 0. En d'autres termes, il faut 
et il suffit pour cela que toutes les valeurs moyennes du 
type <YxZiy, (1 <k<p et 1<7< q) soient nulles. 

d - Généralisation de (58) et (60). 

Soit À une matrice de dimension 4 x N. La transforma- 
tion 
(62) Y = AX 


définit un vecteur aléatoire Y qui suit une loi N (Y, W), 
où W = À V AT. Si V est régulière, on peut trouver une 
matrice À telle que W = 1 (matrice unité), de telle sorte 
que Ÿ suive une distribution N (Ÿ, 1) normale, centrée 
et réduite, à & dimensions. 


Processus et fonctions 
stochastiques 


Chaînes de Markov 


Considérons un espace 6 d'événements aléatoires a. 
Nous avons étudié le problème du tirage répété des événe- 
ments de l’espace 6, quand la probabilité affectée à chaque 
événement a; ne dépend que de cet événement et reste 
la même tout au long de la série d'épreuves. 

Supposons maintenant que la probabilité affectée à 
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l'événement 4; ne dépende pas seulement de cet événe- 
ment, mais encore des événements survenus au cours des 
tirages précédents. On dit que les épreuves successives 
forment une chaîne. Un cas particulièrement fréquent est 
celui où les probabilités en question ne dépendent pas 
des résultats de tous les essais précédents, mais seulement 
du dernier d'entre eux. On dit, dans ce cas, que la chaîne 
des événements {a;} successifs est une chaîne de Markov. 

Dans un processus markovien, on a donc à considérer 
les probabilités P;; — P; (4;/4;) pour que l'événement 4; 
se produise au n-ième essai, sachant que l'événement a; 
s'est produit à l'essai précédent. Un exemple particulière- 
ment remarquable de processus markovien est donné par 
le mouvement brownien des petites particules colloïdales 
en suspension dans un liquide, quand on les observe 
au microscope. Sous l'effet des chocs aléatoires des 
molécules du liquide, la particule subit des déplacements 
aléatoires, sa position à l'instant de la n-ième obser- 
vation dépendant de sa position à la (n— 1)-ième 
observation (fig. 14). 

Au lieu de parler de l’espace 6 des événements possibles 
a; (i = 1, N), on parle souvent de l’espace 6 des N états 
possibles. Le passage de l'état a; à l'état a; est alors appelé 
transition à; — a;j. Dans le mouvement brownien, il y a 
une infinité d'états possibles (les positions de la particule 
colloïdale) et la transition est le passage d’une position 
à l'autre. 

Les probabilités de transition P;; forment une matrice 
stochastique P. Cette dénomination est liée à la propriété 
suivante : 

N N 
D Py= D Pr(a/a)=1 
FE F1 
(la somme des éléments de la matrice le long d'une même 
ligne est égale à 1), car au cours d'une transition, le 
système ne peut passer que de l'état / à l’un des N états 
possibles. 

La probabilité pour que le système passe de l'état ; à 
un état / en deux étapes est la somme sur k des transitions 
di > 4x, 4x > 4j: 


N 
Py® = + Pix Pxj 
k=1 
c'est-à-dire P@ = p? 
Par suite : PG) = pr 
et si on appelle z — |+1.…#x|la matrice ligne représen- 


tant les probabilités pour que le système se trouve, à 
l'instant initial, dans l'état (a1,…, ax), la probabilité 
pour que, après n étapes, les systèmes se trouvent dans 
l'état / est donnée par: 


PG) = 2 ri PE) 
j p ij 


soit : PO = mp? 

Une chaîne pour laquelle, à partir de n'importe quel 
état, on peut atteindre n'importe lequel des autres états 
(après un nombre variable d'étapes) est appelée chaîne 
ergodique. Mathématiquement, une chaîne ergodique 
est définie par la propriété suivante : pour tout couple 
d'états initiaux et finals / et k, la matrice stochastique 
est telle qu'il existe une puissance P* de P telle que 


(Prhix £ 0. 

S'il existe une puissance 7 de P, soit P?, telle que tous 
les éléments (P”);4 sont différents de zéro, la chaîne 
est appelée régulière. Dans une chaîne régulière, tous les 
états peuvent être atteints à partir de n'importe quel état 
initial, en n étapes exactement. 


Équilibre statistique 
Les chaînes ergodiques et les chaînes régulières pos- 
sèdent les importantes propriétés suivantes : 
a - pour une chaîne ergodique, 


Da pr 
lim F + ss FE = À 
A+ n 
où À est une matrice stochastique dont toutes les lignes 
sont identiques. La matrice ligne g — ar, 42 … a, | qui 


les compose est telle que 4P = x; 


b - pour une chaîne régulière : 
lim Pz—= A 


n+ 


(63) 


où A est une matrice stochastique dont toutes les lignes 
sont identiques. La matrice ligne g — |la1, 42 … ax | qui 
les compose est telle que x P = x. 

En d’autres termes, pour une chaîne régulière, il arrive 
un moment où l'addition d'étapes supplémentaires ne 
modifie plus sensiblement les probabilités pour que le 
système se retrouve dans tel ou tel état, et ces probabi- 
lités sont les mêmes quel que soit l’état initial : un équi- 
libre statistique s'établit entre les diverses transitions 
possibles. 

Nous ne démontrerons pas ces propriétés dans le cas 
général, mais nous pouvons aisément vérifier la seconde 
dans le cas simple où N = 2. Dans ce cas, la matrice 
stochastique s'écrit : 


Pii Pi 
P21 P22 

La probabilité pe d'obtenir l'état (1) à partir du même 
état, après n étapes, est: 


ST : 
p$® = pfi7 9 pu + pf 


P — 


TD Don 


De même : 
pi = ph" 
Utilisons le fait que : 
pa D = 1 — pp D 


et 
pai = 1 — pa; 
PS = pli” pu + (1—pft 7) (1 — pa2) 
= p@% D (p1i + p22 — 1) + (1 — pa). 
Posons : qg = (pu + pza—1) 
F= pu 
S = 1 — p22. 
On obtient : pD = ph-D ques. 
De même : po = pa D or. 


Par récurrence, on obtient : 


64 RU ou cm ES 2 qe 
(64) Pi at ty 
65 (D net pis le 
(65) ne Pr LE 


qui donne bien 


pe 9 = 1; 00 = pape = 0 


Les autres termes de P* sont: 


(66)  pf?—1—pf?, pED = 1 — pE. 

Si la chaîne à deux états est régulière, |g| < 1. En effet, 
lg| = 1 impliquerait, soit p11 — po2 = 1 (les états (1) et 
(2) restent toujours identiques à eux-mêmes), soit 
pui = p22 = 0 (les états (1) et (2) se changent toujours 
alternativement l'un dans l’autre). On a donc lim g*=0. 


n—+ 
Par suite : 
S F 
1—g 1—39g 
lim PŒ) = A— 
n—> © S if 
1—q 1—39g 


où nous avons utilisé (64), (65) et (66). La matrice À 
a bien les propriétés indiquées en (63). 


Applications 

Une application particulièrement simple des chaînes 
de Markov est constituée par le problème du cheminement 
aléatoire à une dimension. Supposons que la puce Pépita 
puisse sauter le long d'une ligne, de la position 1 à la 
position N (#g. 15). Quand elle se trouve dans une 
position £k£ 1 N, elle a une probabilité p de sauter 
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vers la position & — 1, et une probabilité g de sauter vers 
la position # — 1. Les positions extrêmes 1 et N peuvent 
être des cages (p11 — pxx = 1, auquel cas les positions 1 
et N sont dites absorbantes), ou des ressorts qui renvoient 
Pépita vers la position adjacente (p12 = px, x -1 = 1, 
auquel cas les positions 1 et N sont dites réflexives). 

Les matrices stochastiques correspondant à ces deux 
chaînes sont : 


1 00 0 010 0 
lg 0 p 0 gO0p 0 
eÊs0 0 Be #0 0 
0 … qgOpl (0) g0p 
10 001 0 010) 


respectivement. La probabilité pour que, dans le premier 
de ces exemples, la puce Pépita partie de la position ; 
se retrouve après n sauts dans la cage de la position 1 est 
(P*);:1. La probabilité pour qu'elle s'y retrouve enfermée 
après un nombre quelconque de sauts est r;, que nous pou- 
vons calculer de la façon suivante : au premier saut, la 
puce a la probabilité p de se retrouver en / + 1 et q 
de se retrouver en / — 1. Par conséquent : 


(67) = pli+1i+ gri-1 
valable pour 2 < / < N — 1, à condition de poser 
(68) 


Pour résoudre cette équation, posons 7; — x?. En substi- 
tuant r; dans (67), on obtient : px?— x — q = O0, qui 


fi = 1, = 0 


admet deux solutions (sauf Si p=g—= 5 x= 1 et 


x = À Comme (67) est une équation linéaire aux diffé- 
rences finies, la solution générale est : 


n=A-+8(f). 


Les conditions initiales (68) fixent À et B. Finalement : 
g\\-i q\i-1 
= 


© 1 : 


(69) 


li = 


Dans le cas où p = qg = 5 l'équation (67) s'écrit : 
2n=n+1+n-1 

N— ; 

N—1 

Naturellement, la probabilité pour que Pépita rentre dans 

la cage située à la position N est 1 — x. 

Un problème tout à fait semblable est celui de deux 
joueurs A et B. La mise initiale de A est de j francs, 
celle de B est N — ; francs. À chaque partie, À a la 
probabilité p de gagner 1 franc, et qg de perdre 1 franc. 
La probabilité pour que, après un nombre quelconque 
de parties, A soit ruiné est évidemment donnée par (69), 
après substitution de N — 1 par N, et / — 1 par ;, car aux 
N états correspondant au capital 1, .N francs pour A 
il faut ajouter l'état pour lequel ce capital est de O franc. 

Prenons pour terminer un exemple d'application des 
chaînes de Markov à la génétique. Supposons qu'un 


et, compte tenu de (68), admet pour solution ri; — 
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A Figure 15 : 

chaînes dont les états 
extrêmes sont absorbants 
ou réflexifs 

(cas de la puce Pépita). 


dépendant d'un seul 


A Figure 16: 


deux exemples 
de fonctions aléatoires 


paramètre t. 


Y Figure 17: 


voir développement 
dans le texte page 189. 
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certain caractère soit lié aux chromosomes d'une certaine 
paire. Appelons D tout chromosome portant ce carac- 
tère, et d tout chromosome qui ne le porte pas. La paire 
de chromosomes en question, chez un individu donné, 
peut donc être l’une quelconque des combinaisons DD 
(état « dominant »), Da (état « hybride ») ou da (état 
« récessif »). 

Le croisement d'un individu dominant (DD) avec un 
individu hybride (Dd) peut donner lieu, comme on le voit 
aisément, aux combinaisons suivantes chez leurs enfants : 


DD (probabilité j ou Da (probabilité à). 
Celui d'un individu hybride avec un individu hybride 
peut donner lieu aux combinaisons suivantes : DD (). 
4 4 4, 
Da G). dd (2): 
Celui d'un individu récessif avec un individu hybride 
peut donner lieu aux combinaisons suivantes : Da 6) 
’ ) 
dd (5) 
Au total, le fait de croiser un individu quelconque avec 


un individu hybride est un processus markovien dont la 
matrice stochastique est : 


LP) 


Co 
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(e] 


tU 

[ 
© Fi Ni= 
NI= Ni NI 
NÉRSE 


Si nous croisons de nouveau les enfants de la 1"° géné- 
ration avec un individu hybride, les probabilités d'obte- 
nir les états dominants, hybrides ou récessifs à la deuxième 
génération sont données par : 


#17 
828 
141 
= |= = — 
F3 
Le 
828 


qui ne possède pas d'élément nul. Le processus marko- 
vien en question est donc une chaîne régulière. Sa limite 
pour un nombre très grand de générations est évidem- 
ment : 


111 
422 

. 111 
RE er 

io 123 
Lu 

123 


car les multiplications successives de P par lui-même 
préservent la 2° ligne de P. On a donc le résultat suivant : 
quel que soit l'état de l’aïeul que nous avons croisé avec 
un hybride, si toutes les générations successives sont 
systématiquement croisées avec des hybrides, il s'établit 
au bout d'un grand nombre de générations un équilibre 


Sa 1 > 
statistique tel que z des enfants sont du type dominant, 


1 


1 ; è 
: du type récessif et 3 


du type hybride. 


Fonctions aléatoires 


Une fonction aléatoire est une fonction fx (t) dont la 
forme dépend du résultat du tirage d'une (ou plusieurs) 
variable aléatoire X. Les fonctions aléatoires peuvent être 
définies sur le corps des réels ou sur celui des complexes; 
et elles peuvent dépendre d'un seul ou de plusieurs 
paramètres t. Nous ne nous préoccuperons ici que des 
fonctions aléatoires à valeurs réelles, dépendant d'un seul 
paramètre £. Le plus souvent, ce paramètre est le temps 
(auquel cas la fonction aléatoire est à proprement parler 
un processus stochastique), mais cela n'est pas nécessaire. 

La figure 16 présente deux exemples de fonctions 
aléatoires de ce type. La fonction #1 (t) est la fonction 
obtenue quand l'événement X — x1 est réalisé, et la fonc- 
tion f2 (t) est la fonction obtenue quand l'événement 
X — x2 est réalisé. 

A un instant { = t1 fixé, Ÿ = fx (1) est une variable 
aléatoire. Appelons f (y1; t1) la densité qui lui est asso- 
ciée. Les propriétés statistiques de la fonction aléatoire 
sont définies par la connaissance de toutes les densités 
de probabilité : 

(70) F(YL Ya. VS: tite, tn) 
pour que Ÿ prenne la valeur y1 en é1, y2 en t2 … x en fx 
pour un ensemble quelconque d'instants #1, …, £x. 


Naturellement, on peut aussi considérer la fonction 
caractéristique : 


© (U1, …, UN: t1, .…, 1x) = Î et (U1Y1 +... UXYX) X 
F(YL Yi ti, …, tx) dy1, …, dyx 
dont la connaissance équivaut à celle de 


f (y, een MN LT voi tx) 
[voir (26)]. 
Les moments les plus simples associés à (70) sont : 
— l'espérance mathématique 


€ >= [y (:0 dy: 


— la covariance 
y1 (1) ve (t2)D = [ yavaf (y vai tte) dyidys 


qui donne, en faisant {1 — {2 = t, le moment d'ordre 2 
associé àf (y:t). 


Fonctions aléatoires stationnaires 

Une fonction aléatoire fx (ft) est dite stationnaire si 
toutes ses propriétés statistiques sont invariantes pour 
toute translation de l'axe des temps. Autrement dit 
fx (#) est stationnaire si les densités de probabilités (70) 
ne dépendent que des différences fe — 11, …., x — t1 et 
non de la valeur particulière é1 : 


F (Vas Var Vi ta ta, x) = 
F (pas Vas Ya to — ti, tx — à) V à. 


Dans ce cas, le moment d'ordre 1, {y (#)», ne peut être 
qu'une constante indépendante de t. La covariance est 
une fonction de la différence + — t— t1. Elle s'appelle 
la fonction de corrélation de fx Gi: 


C (=) = <y1 (8) y2 — 7) 
Ilest clair que C (+) est une fonction paire de =: 
C (+) = <ya (6) ve (—7)D = <y1 (t— 7) y2 (0 » = C (5) 
et qu'elle est maximale pour + = 0 : 

[C (r)|< © (0) = <y2 (> 


En effet le coefficient de corrélation entre y (ét) et 
y (t + +) est : d'après (47) 

.COyE-me On. CO 
° <2 (DD>—<y D  C(0)—<y >? 

La fonction de corrélation mesure donc, en quelque 
sorte, la « rigidité » de la fonction aléatoire fx (t). Moins 
la valeur y (t) prise par cette dernière à l'instant t influe 
sur les valeurs qu'elle peut prendre à l'instant voisin 
t+ 7, plus la fonction de corrélation tend rapidement 
vers O (fig. 17). 

Si la fonction de corrélation C (+) est continue à 
l'origine, la fonction aléatoire fx (t) est continue en 
moyenne quadratique, c'est-à-dire que l'on a: 


. <[y Sr Per A (2 
247 @+T)y(0=21C (0)—C(]1= 


Une fonction aléatoire dont l'espérance ent 
{y ()> = m est stationnaire, et dont la covariance 
<Y1 (t1) ve (2)> = C (r = t1 —t2) est continue à l'origine 
et est également stationnaire, est dite fonction aléatoire 
stationnaire d'ordre deux. Une telle fonction, dont les 
premiers moments sont stationnaires, n'est pas nécessai- 
rement stationnaire au sens strict puisque nous n'impo- 
sons pas de condition de stationnarité pour les moments 
d'ordre supérieur. Cependant, une fonction aléatoire 
gaussienne, c'est-à-dire telle que toutes les densités 
de probabilités (70) sont des distributions normales à 
N dimensions, est stationnaire au sens strict si elle est 
stationnaire d'ordre deux. Cela résulte du fait que tous 
les moments d'une distribution normale sont fixés, si 
les deux premiers moments le sont. 


Analyse harmonique 

Dans de très nombreux arrangements expérimentaux 
de physique (en électronique et électrotechnique en 
particulier) les appareils utilisés transforment la fonction 
aléatoire y = fx (t), dite signal d'entrée, en une autre 
fonction z — ox (t), dite signal de sortie. La transforma- 
tion F:fx (0) + ?x (t) est le plus souvent linéaire et 
homogène, c'est-à-dire qu'elle obéit aux relations : 


{ fx (t) — 2ox (t) VA réel ou complexe 
Ufx (©) + fx (0 — ox (t) + ox (©) 
(72) fx (t— to) — ox (ft — to) 


Les fonctions exponentielles ect sont les fonctions 
propres de telles transformations : 


(73) 


Pour cette raison, il est extrêmement important de 
savoir décomposer un signal d'entrée en somme d'expo- 
nentielles complexes (ou, de facon équivalente, en somme 
de fonctions sinus). C’est ce que l'on appelle faire l'ana- 
lyse harmonique du signal d'entrée. 


(71) 


eimt — Jeict, 


Vérifions la propriété (73). Pour cela, appelons R (t) 
la transformée de la fonction de Dirac à (t) dans la trans- 
formation linéaire $. Étant donné (30) : 


y () = F7 y (6) à (£— 0) dô 
nous avons, par suite pes (71) et (72) : 
(74) 240 = [°° y @)R (—0) do 
Si y (8) = eics, hou na = 
(75) z( = |" et 00R (£—0) 90 — g (a) eïct 
où 
(76) g (a) = [7 Fe-ter À (e) dr 


est appelé le gain de la transformation %. L'équation (75) 
est bien identique à (73) avec À — g (w). 

La transformation de Fourier, déjà introduite en (25) 
est à la base de l'analyse harmonique, puisqu'elle consiste 
à écrire y (t) sous la forme de sommes d'exponentielles 
ect, On a: 


r@= [7° 


Rs n (v) dv 


(v) = 1 & iot y (t) dt 


où Van 
27 


Fourier de la « réponse percussionnelle », c'est-à-dire de 
la réponse à un signal en forme de fonction de Dirac. 
Un filtre passe-bande est caractérisé par un gain tel que 


g (v) = Siv< vi OÙ v> v 
g (v) = US V< V2 
La réponse percussionnelle correspondante est : 


Le gain (76) est donc la transformée de 


. G1+ 2 
t— 


RÜ=é. 


sin 7 (v2 — V1) t 
rt 


Supposons que la fonction de corrélation C (+) du 
signal d'entrée possède une transformée de Fourier y (v) : 


rie (°° 


+ — œ© 


(77) e-ior C (+) d= 


(78) co=f" 


La transformée de ER de la fonction de corréla- 
tion est une fonction réelle et paire, parce que C (+) est 


réelle et paire. De plus, elle est toujours positive, comme 
cela résulte de l'importante propriété suivante : 


Ge @OP> = [7x © le CHE ds 
En effet : €|z (t)|2 
= € [y (61) R (— 01) y (62) R° (t—6:) 00100: 


2 eier y (9) dv. 


(79) 


où nous avons utilisé (74) et compte tenu du fait que la 
réponse peut être une fonction complexe. 


€Iz OP> = 

F1 <y (61) y (62) R (t— 61) R° (t— 62) dô: dô2 
= | fe (61— 602) R (t— 61) R° (t— 62) d61 d62 
Introduisant (77) : 
<Iz OP = 
| [ l'eic G:—62)+ (v) R (t—61) R* (t—62) d61 dôo dy 
= [+ () LR (t— 01) ete Ë—861) ELA 

LR «@— 6) eiot-59 ge]as 


F7 + Cle OP à. 


oc 
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A Le jeu de la roulette : 
l'erreur, ici, est 

de confondre les notions de 
fréquence et de nombre 
de cas favorables. 
L'écart type 

sur la première diminue 
avec le nombre 

de coups joués, 

mais celui sur le second 
augmente. 


Enfin, de (78) et (79), on déduit que : 


(80)  <y2 (#9 = C (0) = il ù 


y (9) dv 
Le] 


(1) 2 @P>= [ro dv 


où z (t) est la réponse obtenue après passage dans un 
filtre passe-bande pour la bande de fréquence (1, v2), 
par suite de la définition du gain correspondant. Les for- 
mules (79), (80) et (81) relient les puissances moyennes 
des signaux d'entrée et de sortie à la connaissance de la 
transformée de Fourier y (v) de la fonction de corrélation. 


Quelques considérations 
sur les probabilités 


Les probabilités et la vie courante 


La mémoire de la chance 

Le hasard n'a ni conscience ni mémoire. Cette vérité 
d'allure banale est pourtant à l'origine d'un des aspects 
les plus paradoxaux de la théorie des probabilités, celui 
qui heurte le plus le sens commun. 

Ilest difficile à quelqu'un qui joue à la roulette d'admettre 
que, s'il a observé depuis le début de la partie une série 
de cinq coups pendant lesquels « rouge » est toujours 
sorti, la probabilité d'obtenir « rouge » au sixième est 
encore exactement égale à la probabilité d'obtenir « noir ». 
Il lui semble que, puisque au cours d'une très longue série 
de coups les nombres de « rouges » et « noirs » sont 
toujours à peu près égaux, si on a observé au départ une 
longue série de « rouges », la roulette doit se rattraper en 
jouant « noir » plus souvent par la suite. 

L'erreur, ici, est de confondre les notions de fréquence 
et de probabilité, d'une part, et de nombre de fois que 
« rouge » et « noir » sortent dans une partie, de l'autre. 
Il'est parfaitement exact que, conformément à la deuxième 
loi des grands nombres, dans une suite de tirages répétés 
et mutuellement indépendants, la fréquence doit tendre 
vers la probabilité et que l'écart type sur la fréquence 
diminue quand le nombre de coups joués augmente. Mais 
l'écart type sur le nombre de fois que l’on obtient «rouge», 
ou « noir », lui, augmente comme la racine carrée du 
nombre de coups joués. Un grand écart par rapport à 
l'espérance mathématique dans une première série de 
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coups n'implique pas un écart en sens contraire dans la 
deuxième série. Les écarts types des diverses séries 
s'ajoutent toujours quadratiquement, conformément à la 
relation (35), quand les séries sont mutuellement indé- 
pendantes. 

Pourtant le type de raisonnement du joueur de roulette 
ci-dessus est extrêmement fréquent. Citons ainsi la 
réflexion selon laquelle, puisqu'on n’a pas eu d'accident de 
circulation avec sa voiture depuis longtemps, on serait 
plus particulièrement menacé d'en avoir un dans un 
proche avenir, ou encore celle selon laquelle, étant donné 
qu'il fait mauvais depuis quarante jours, la chance 
devient plus grande pour qu'il fasse beau le lendemain, 
ne serait-ce que pour vérifier l'adage « après la pluie le 
beau temps ». Dans ces deux derniers exemples, c'est le 
contraire qui est vrai, car les épreuves successives ne 
sont pas absolument indépendantes, il existe un coeffi- 
cient de corrélation positif entre eux (une journée de 
mauvais temps, au moins sous les climats tempérés, 
entraîne une plus grande probabilité de mauvais temps 
pour le lendemain). 


Les probabilités négligeables 

Un deuxième aspect subjectif de la théorie des pro- 
babilités provient de la difficulté d'appréhender correc- 
tement les chances qu'un événement qui a une très petite 
probabilité de se produire se produise effectivement. 
E. Borel parle à ce sujet de la « loi unique du hasard », 
loi que l'on peut formuler ainsi : un événement qui a une 
probabilité négligeable ne se produit pas. Pourtant on 
entend fréquemment autour de nous des réflexions du 
type suivant : puisqu'il y a cent mille billets à cette tombola, 
j'ai une chance sur cent mille de gagner le gros lot. 
Comme de toutes facons quelqu'un gagne ce lot, pourquoi 
ne serait-ce pas moi? Ainsi se persuade-t-on d'acheter 
un billet. Du point de vue de la seule théorie des proba- 
bilités, cependant, il faudrait jouer cent mille fois à cette 
tombola (ce qui est impossible au cours d'une vie) pour 
avoir une chance sérieuse de remporter ce gros lot. 

Ainsi, à la question : à partir de quel niveau peut-on 
considérer une probabilité comme négligeable ? la théorie 
des probabilités répond : quand le nombre d'épreuves est 
très petit devant l'inverse de la probabilité. Le nombre 
d'épreuves varie énormément suivant la nature de l'événe- 
ment considéré. || est donc utile de fixer quelques ordres 
de grandeur. 

— La vie d'un homme adulte est d'environ 

20 000 journées. Nous pourrons donc, chacun pour soi, 
légitimement vivre sans souci des événements qui pour- 


raient nous arriver, et dont la probabilité de se produire, 
par personne et par jour, est petite devant 1/20 000; 
par exemple : gagner le gros lot d'une loterie de cent 
mille billets (probabilité 10-5, s'il existe un tirage par 
jour) ; avoir un accident mortel de la circulation à Paris 
(probabilité de l'ordre de 107), etc. 

—— La population de la planète est de quelques 
milliards, et si nous cumulons toutes les générations 
passées, le nombre d'êtres humains ayant vécu sur terre 
reste inférieur à 1010. Par conséquent, nous pouvons 
négliger les chances qu'un événement dont la probabilité 
de se produire, par personne et par jour, est petite 
devant 10-15, soit arrivé une fois dans l'histoire 
humaine. Telle est, par exemple, la probabilité d'obtenir 
50 fois « pile » en suivant au jeu de pile ou face. Considé- 
rant que tous les hommes de tous les temps n'ont cer- 
tainement pas joué en moyenne une partie de cinquante 
coups de pile ou face chaque jour, il est pratiquement 
exclu qu'un tel événement se soit effectivement produit, 
même une seule fois. 

— Certaines lois de la physique, en particulier les 
lois de la thermodynamique, sont des lois statistiques. 
Le deuxième principe de la thermodynamique, par 
exemple, nous enseigne qu'une fois l'équilibre atteint, 
un litre de gaz occupant un ballon d'un litre l'occupe 
uniformément, les molécules ne se groupant jamais, par 
exemple, dans la moitié inférieure du ballon et laissant 
l'autre moitié vide. Évaluons la probabilité de mettre en 
évidence, par exemple, une fluctuation de densité ou de 
pression entre la moitié supérieure et la moitié inférieure 
du ballon, à la précision relative extraordinaire de 1 0 (un 
milliardième). Il y a dans le ballon environ 41 22 molécules 


el 
de gaz, chacune d'elles ayant la probabilité 35 de se trouver 


dans l'une ou l’autre moitié du récipient. L'équation (38) 
nous apprend que la distribution de probabilité d'avoir 
NA molécules dans la moitié inférieure est 


N (Na— 21022, 1011). 


Une fluctuation relative supérieure à 10° correspond à 
Na < 2-1022— 21018 ou Na > 2°102? — 2:1015, c'est-à- 
dire à un écart supérieur à 200 écartstypes (5 — 101). 
La probabilité correspondante est beaucoup plus petite 
que 10-15. 

— On estime généralement que le nombre d'atomes 
de matière dans l'univers est inférieur à 10100 atomes, et 
qu'il s'est écoulé, depuis le big bang primitif, environ 
12 milliards d'années, soit un temps inférieur à 101$ &. 
Tout phénomène physique de l'échelle atomique qui aurait 
une probabilité de se produire inférieure ou de l'ordre 
de 10-120 par seconde n'a donc pratiquement aucune 
chance de s'être jamais réalisé dans l'univers. 


Probabilités d'ignorance 
et indéterminisme fondamental 


Dans la plupart des applications de la théorie des 
probabilités, l'événement aléatoire survient au terme 
d'une succession de causes physiques qui entraîne inéluc- 
tablement son apparition. Ainsi, connaissant parfaitement 
la position du dé au moment où il est lancé, l'impulsion 
que lui donne le joueur, et la géométrie et les conditions 
de rugosité des faces du dé et de la table, il est, en principe, 
possible de prédire quel sera le numéro tiré. Mais l'éche- 
veau des causes est si embrouillé qu'il est impossible de 
faire le calcul. Dans ce cas, l'utilisation du calcul des 
probabilités ne fait donc que cacher notre incapacité 
pratique de calculer la trajectoire du dé. Bien entendu, 
le plus souvent, certaines données des problèmes posés 
nous échappent. Ainsi, nous ne connaissons pas exacte- 
ment la position et l'impulsion initiales du dé, etc. Dans 
les problèmes de physique statistique, notre ignorance 
est encore plus grande : nous ignorons généralement 
tout de la position et de l'impulsion initiales de chacune 
des 4°1022 molécules d'un litre de gaz. Dans les jeux de 
hasard, cette ignorance est parfois volontaire (les cartes 
sont distribuées retournées). Bref, dans tous ces cas, on 
parle de probabilité d'ignorance. 

Notre ignorance des paramètres du problème n'exclut 
nullement que les grandeurs physiques correspondantes 
aient réellement une valeur, mais nous ne voulons pas 
ou nous ne pouvons pas les mesurer. L'efficacité du calcul 
des probabilités, dans ce cas, tire souvent avantage de la 


multiplicité même des causes pouvant influer sur le 
résultat final. Cette multiplicité détermine généralement 
les conditions d'applications des lois des grands nombres. 

Mais l'on sait, depuis 1927, que l'ignorance n'est pas 
le seul fondement possible du concept de probabilité. 
L'avènement de la mécanique quantique a montré, au 
contraire, qu'il est impossible d'assigner une valeur précise 
à la plupart des grandeurs physiques généralement atta- 
chées à un système physique concret (atomes, molé- 
cules, etc.). En particulier, il est impossible de construire 
un arrangement expérimental tel qu'à la fois la position 
et la vitesse d'un atome aient une signification précise. 
Le résultat de la mesure de telles grandeurs est le résultat 
d'un tirage au hasard, qui n’est déterminé par aucune 
cause sous-jacente (pour autant, du moins, que la théorie 
physique actuelle soit correcte). Ce hasard est le reflet 
d'une solution de continuité fondamentale dans les pro- 
cessus de mesure. On dit, non sans un certain excès de 
langage, qu'il s'agit d'un indéterminisme fondamental. 
Comme tous les corps, même ceux à notre échelle, même 
ceux à l'échelle astronomique, obéissent, en dernier 
ressort, aux lois de la mécanique quantique, on voit que 
le concept de probabilité a sans doute des racines plus 
profondes et une portée beaucoup plus large que la 
simple probabilité d'ignorance, par laquelle il a été histo- 
riquement fondé. 


Quelques exemples 


Le paradoxe de Saint-Pétersbourg 

Pour se libérer d'une grosse dette envers Paul, Pierre 
envisage de jouer avec lui au jeu de pile ou face, de la 
façon suivante : au premier coup, si la pièce montre « pile » 
le jeu s'arrête et Pierre est libéré de sa dette, mais si 
« face » sort, Pierre donne deux francs à Paul et le jeu 
continue une autre fois; si, au deuxième coup, « pile » 
sort, le jeu s'arrête; si « face » sort, Pierre donne quatre 
francs à Paul et le jeu continue encore. 

A chaque partie perdue par Pierre, celui-ci donne à 
Paul le double de la somme qu'il lui a donnée à la partie 
précédente. Le jeu s'arrête dès que, enfin, « pile » sort. 

Afin de connaître si cette façon de jouer est avantageuse 
pour lui, Pierre calcule l'espérance de gain de Paul. 
Il trouve que cette espérance est de un franc pour la 
première partie, de un franc encore pour la seconde (une 
chance sur deux de jouer cette partie et une chance sur 
deux de gagner 4 francs), de un franc encore pour la 
troisième, et ainsi de suite. Au total, l'espérance de 
gain de Paul est infinie. Aucune dette ne vaut la peine 
d'accepter les règles de ce jeu. 

En pratique cependant, la réalité est fort différente. 
Si Pierre perd les 7 premières parties, il doit donner à Paul, 
partie après partie, une somme totale de 


2+4+.2r=2n+1 


Il ne peut se permettre de perdre qu'un petit nombre de 
fois, faute de quoi il se trouve bientôt insolvable. Possédêt- 
il 10 millions de francs, il ne pourrait perdre sans faire 
faillite que 22 fois en suivant. L'espérance de gain de 
Paul, en définitive, n'est donc que de 22 francs. 

L'exemple ci-dessus nous amène à méditer sur le 
comportement des personnes qui, jouant aux jeux de 
hasard (roulette), appliquent la tactique suivante : en 
cas de perte, doubler la mise avec obstination et rejouer, 
jusqu'au succès final. En réalité, même si, dans un jeu 
parfaitement équitable, le joueur qui applique cette 
tactique est assuré de finir par équilibrer ses pertes, voire 
d'obtenir un bénéfice, l'avantage décisif de la banque 
vient de ce qu'elle est normalement capable de pousser 
le jeu plus loin du côté des pertes que les joueurs. Ceux-ci 
sont acculés à la faillite avant elle, et, par suite, l'espé- 
rance de gain de la banque est en faveur de cette der- 
nière. 


2 francs. 


Le problème de l'aiguille (Buffon) 

Supposons que nous ayons un parquet, fait de lames 
de bois parallèles de largeur 2 a, et que nous lancions 
sur ce parquet, au hasard, une aiguille rectiligne de 
longueur 2 / < 2 a. Quelle est la probabilité pour que 
l’aiguille coupe une des raies du parquet ? 

On voit immédiatement sur la figure 18 que le problème 
dépend de deux variables aléatoires indépendantes 
l'ordonnée y (— a < y < a) du point M, milieu de 
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Figure 18 : 
le problème 
de l'aiguille (Buffon). 


Richard Colin 


l'aiguille, par rapport à la ligne de parquet la plus proche, 
et l'angle © = < 9 < 3) que fait l'aiguille avec la per- 
pendiculaire tracée de M sur les lignes du parquet. Ces 
deux variables aléatoires admettent des densités de pro- 
babilités uniformes : 


comme / < a, l'aiguille ne peut couper que la raie consi- 
dérée. La condition nécessaire et suffisante pour cela est 
ly| < / cos ©. 

Par (3), la probabilité p cherchée est 


a 1 cos ? D 1 
p= | _f2(e) d LAC nt 


—lcos + 


En son temps (le XVII® siècle), ce résultat a beaucoup 
intrigué les philosophes. Comment un problème dans 
lequel il n'est question que de réseau et de segments recti- 
lignes peut-il engendrer le nombre +? Quel rapport ce 
nombre entretient-il avec les fondements de la théorie 
des probabilités ? Cette curiosité, toutefois, est sans objet. 
Le nombre 7, comme le prouve par exemple le dévelop- 
pement en série de Taylor de la fonction y — arc tg x, se 
retrouve comme valeur de beaucoup de séries de frac- 
tions rationnelles. Le problème de l’aiguillereste néanmoins 
une curieuse et amusante facon de mesurer ce nombre. 
L'astronome Wolf, en 1850, fit 5 000 épreuves et mesura 
la fréquence des succès. || en déduisit z — 3,1596. 
L'écart observé est tout à fait compatible avec la distri- 
bution des résultats de mesure prévue par la deuxième 
loi des grands nombres. 


Des garcons et des filles 

Soit le problème suivant (Gamow) : dans un pays 
où la polygamie est admise, un édit indique que les femmes 
ayant accouché d'un garcon doivent être stérilisées ; limi- 
tant ainsi le nombre de garcons, la loi espère augmenter 
la proportion de filles dans la nation. Dans ce pays, il 
n'y a donc que des familles avec un garcon, une fille et 
un garçon, deux filles et un garçon, … n filles et un garçon. 
La pratique de la stérilisation limite évidemment le nombre 
moyen d'enfants de chaque famille. Augmente-t-elle 
cependant, comme on pourrait le croire, la proportion 
de filles ? 

La réponse est non. Car, au premier accouchement, 
toutes les femmes ont autant de chances de mettre au 
monde un garcon qu'une fille. Et à l'accouchement sui- 
vant (qui ne concerne plus que la moitié des femmes, celles 
qui ont une fille première-née), les mêmes ont encore 


une probabilité 3 d’avoir un garçon ou une fille. Et ainsi 


de suite. 

Le nombre moyen de garçons par famille avec enfants 
est évidemment un. Celui des filles, malgré les apparences, 
est un également : les familles avec plusieurs filles ne font 
que compenser les familles à fils unique. On a: 


SO n—1 
n=2 
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Les probabilités en biologie 


Depuis les travaux de Mendel (1865), les biologistes 
sont convaincus de l'importance de la théorie des pro- 
babilités pour l'explication d'un très grand nombre de 
phénomènes biologiques tels que la reproduction, les 
mutations génétiques dans les chromosomes, la répli- 
cation de ceux-ci dans la division cellulaire, etc. L'inter- 
vention du hasard dans les phénomènes vitaux est même 
si grande que certains voient en lui l'explication fondamen- 
tale des phénomènes de la vie et de l’évolution (par 
exemple, le livre de Jacques Monod, /e Hasard et la 
Nécessité). 

La génétique et ses deux grandes branches, la génétique 
des populations d'une part, la génétique évolutive de 
l'autre, font donc un très large appel aux techniques 
statistiques. 

À partir d'un petit nombre de constituants (quatre 
atomes essentiels, carbone, oxygène, hydrogène, azote), 
on fabrique par combinaison un nombre plus grand de 
briques fondamentales de la matière vivante : les 20 acides 
aminés. Quatre molécules, toujours les mêmes, consti- 
tuent les barreaux des longues chaînes de la double hélice 
de l'acide désoxyribonucléique, qui peut comporter jusqu'à 
107 ou 108 échelons. L'ADN présent dans les chromosomes 
détermine le patrimoine héréditaire. Celui-ci est préservé 
dans la réplication, phénomène intervenant dans la divi- 
sion cellulaire, et combiné dans la reproduction. Dans ce 
dernier phénomène, le patrimoine héréditaire d’un indi- 
vidu est combiné (généralement à parts égales, mais 
parfois non, comme dans la reproduction bactérienne) 
avec le patrimoine héréditaire d'un autre individu, sur 
la base du hasard. 

Le hasard intervient aussi dans les phénomènes de 
mutation, c'est-à-dire de changement dans l’ordre où dans 
la structure des barreaux de l'ADN. Ces mutations peuvent 
être induites (elles peuvent par exemple être le résultat 
accidentel du passage d'un rayon cosmique) ou spon- 
tanées, en particulier au cours de la réplication. Certains 
pensent même que les mutations spontanées pourraient 
avoir une relation avec l'indéterminisme fondamental 
dont nous avons parlé plus haut, la fonction d'onde de la 
molécule d'ADN pouvant assumer virtuellement plusieurs 
états avec des probabilités de réalisation pour chacun 
d'eux. Quoi qu'il en soit, il existe donc en général une 
probabilité petite, mais non nulle, de transformation géné- 
tique à chaque étape de la division cellulaire. La stabilité 
du patrimoine héréditaire ne peut donc s'expliquer que par 
l'intervention d'équilibres entre des transitions en sens 
inverses, comme nous en avons mentionné dans l'étude 
des processus markoviens. 

Chez l'homme, le patrimoine génétique est contenu 
dans les 46 chromosomes. Au cours de la reproduction, 
23 chromosomes du gamète mâle sont combinés deux à 
deux avec les 23 chromosomes du gamète femelle. Il y a 
donc, au total, 43 ensembles complets de chromosomes, 
c'est-à-dire plus de 600 milliards d'enfants génétique- 
ment différents les uns des autres, pouvant être engendrés 
par un même couple de parents. Seuls de vrais jumeaux, 
issus d'une même cellule originale, possèdent exacte- 
ment les mêmes caractères génétiques. Dans tous les 
autres cas, il y a seulement une certaine chance, facile à 
calculer, pour que deux enfants, ou deux individus de la 
n-ième génération, aient dans leur carte génétique le 
même chromosome, et, partant, les mêmes caractères 
liés à ce chromosome. 


Les données statistiques 


La visualisation des données statistiques 


Les réponses à une question donnée, faisant partie 
d'une enquête statistique, varient d'un individu à l'autre. 
On observe que le pourcentage de réponses « oui » 
fluctue selon l'échantillon de personnes interrogées. Pour 
avoir une idée assez précise de la probabilité intrinsèque 
(en admettant qu'elle existe) attachée à cette réponse, 
il faut interroger un échantillon suffisamment large : si les 
conditions d'application de la deuxième loi des grands 
nombres sont remplies, plus le nombre de personnes 
interrogées est important, meilleure sera l'évaluation de 
cette probabilité. 


Le résultat de la mesure d'une grandeur physique fluctue 
selon le type d'appareil utilisé et l’habileté de l'expérimen- 
tateur. Une mesure unique ne donnera, le plus souvent, 
qu'une indication grossière sur la valeur réelle de cette 
grandeur physique : pour avoir une idée plus précise 
sur cette grandeur, il est souvent utile de procéder à une 
série de mesures indépendantes. Les résultats se répar- 
tissent alors de part et d'autre d'une valeur intermédiaire 
« moyenne ». Cette valeur est adoptée comme estimation 
de la grandeur, et les écarts observés autour d'elle donnent 
une indication sur la précision de cette estimation : plus 
les mesures sont dispersées, plus large est la zone d'in- 
certitude sur la valeur réelle de la grandeur. Ici encore, 
plus nombreuses sont les mesures, meilleure est, en 
général, la précision de l'estimation. 

En outre, comme on l'a vu, il existe une classe de phéno- 
mènes physiques (les phénomènes quantiques) pour 
lesquels la grandeur physique mesurée n'a pas de valeur 
définie au moment de la mesure. Ce sont seulement les 
probabilités respectives pour que la mesure de cette 
grandeur donne telle ou telle valeur qui sont définies. 
Pour évaluer avec précision ces probabilités, il faut donc 
procéder à une série nombreuse d'expériences. Chacune 
d'elles, de plus, est entachée d'erreurs expérimentales et 
la détermination des résultats de mesures possibles néces- 
site donc, dans ce cas, plusieurs séries de mesures. 

En définitive, dans de très nombreuses situations, on a 
donc une statistique de résultats. Cette statistique, sous 
forme brute, se présente comme une suite ennuyeuse de 
nombres : la première mesure a donné tel résultat, la 
seconde tel autre, etc. Le problème est de disposer ces 
résultats (par exemple sous forme de graphiques) de telle 
sorte que l'information contenue (par exemple, la liste 
des résultats de mesures possibles pour une grandeur 
quantique et la précision de l'estimation de chacune 
d'elles) soit immédiatement perceptible. C'est le problème 
de la visualité des données dont nous parlerons dans 
cette section. 

Formulons le problème particulier d'une suite de mesures 
d'une grandeur physique AC (ces mesures pourront être 
faites chacune dans les mêmes conditions sur le même sys- 
tème, mais nous ne l'exigeons pas). 

L'ensemble des mesures fournit une statistique de résul- 
tats. Si la première mesure conduit au résultat m1, la 
seconde m2, etc. la statistique se représente comme la 
séquence des nombres (m1, …, Mn). 

Il est clair, cependant, que cette statistique n'est pas 
la séquence des valeurs (u1, …, ur) prises par la grandeur 
au long des mesures, à cause des erreurs expérimentales 
commises. Chaque mesure est entachée d'une certaine 
erreur, qui, en général, varie d'une mesure à l'autre; la 
séquence des y est liée à la séquence des mn par: 


Mi = Wii + ui 


où du; représente l'erreur commise dans la /-ième mesure. 
Le problème du physicien est de déduire, dans la 
mesure du possible, les u; à partir des mi. 

Les erreurs peuvent être de deux types : systématiques 
et statistiques. Les erreurs systématiques découlent de 
certains défauts de l'appareil de mesure. Il appartient 
aux physiciens de chercher à les corriger en améliorant 
l'appareillage et en l'étalonnant avec une meilleure préci- 
sion. Nous ne considérerons pas ici ces erreurs systé- 
matiques, mais le résidu irréductible des erreurs statis- 
tiques, découlant de la précision nécessairement limitée 
des appareils ou d'autres raisons; ces erreurs provoquent 
une dispersion des résultats de mesure, chacun d'eux 
se présentant comme le résultat du tirage d'une variable 
aléatoire « mesure de AC », et ceci même dans le cas de 
mesures faites dans les mêmes conditions sur le même 
système. 

Distinguons ici trois cas. Le premier, et le plus restrictif, 
est celui des résultats de mesures d'une grandeur telle que : 

a - AC prend une valeur unique tout au long de la 
séquence de mesures : ui = U2 = … Un = U0; 

b - les causes d'erreurs sont multiples et indépen- 
dantes. L'erreur totale commise est une variable aléatoire, 
somme d'un nombre très grand de variables aléatoires 
(chaque erreur particulière), chacune d'elles étant régie 
par une « bonne » distribution de probabilité, au sens de 
la seconde loi des grands nombres. 

Nous appellerons C: la classe de statistiques qui satis- 
font aux conditions ci-dessus. La classe C1 comprend les 


séquences de résultats de mesure d'une grandeur 
physique AC effectuée dans les mêmes conditions sur le 
même système, pourvu que les causes d'erreurs soient 
multiples et indépendantes. 

Ces conditions sont approximativement réalisées dans 
l'exemple de la mesure de la longueur d'une table à l'aide 
d'une règle; parmi les causes d'erreurs, citons : la position 
de la règle qui n’est jamais parfaitement d'équerre avec 
le bord de la table, lequel n'est en outre pas parfaitement 
en coïncidence avec la première graduation de la règle; 
l'erreur de parallaxe entre le plan de la table, celui des 
graduations de la règle et les yeux de l'observateur; 
l'épaisseur des graduations et les erreurs d'interpolation 
entre, etc. Un meilleur exemple, célèbre car il a été utilisé 
par Bessel pour vérifier les conclusions de la théorie 
probabilistique des mesures, est celui de la mestre de 
l'ascension droite et de la déclinaison d'une étoile ; dans ce 
cas, en plus des causes d'erreurs du type précédent, on 
trouve les fluctuations de l'indice de réfraction de l'air 
atmosphérique, etc. 

La clause b implique que l'erreur totale est une variable 
aléatoire qui suit (de très près) une distribution gaussienne ; 
si l'appareil est convenablement étalonné, cette distri- 
bution est centrée sur 0. Les mesures faites dans les 
mêmes conditions sur le même système sont donc carac- 
térisées par la distribution des résultats : 


(82) 


Un cas moins restrictif est représenté par la classe C2 
de statistiques de mesures d'une grandeur {€ telle que : 

a - la grandeur AC ne prend pas la même valeur au 
long de la séquence de mesures, mais les valeurs succes- 
sives de AC sont liées entre elles par une relation analy- 
tique connue; 

b - les mesures de .AC sont régies par une distribu- 
tion gaussienne (ou approximativement gaussienne) telle 
que la variance de cette distribution dépend de la valeur u 
prise par A, selon une relation analytique connue, 
6 = 0 (u). 

Un exemple de statistique de cette classe est donné par 
les taux de comptage dans l'observation d'un échantillon 
de substance radio-active. La grandeur AC est le nombre 
moyen de désintégrations par unité de temps. Au cours 
du temps ce nombre diminue suivant une loi exponentielle, 
du type : 


fm) = N (m— 10, 60) 


AN (#) = n e-t/r At 


dans laquelle, en général, les paramètres + et No ne sont 
pas connus. Le nombre réel de désintégrations observées, 


AN, n'est pas le nombre AN, à cause des fluctuations 
quantiques. Chaque atome de l'échantillon a une pro- 
babilité définie de se désintégrer dans l'intervalle de 
temps considéré, et le nombre total de désintégrations 
observées suit une distribution binominale — c'est-à-dire, 
pratiquement, une distribution de Poisson, ou encore 


une distribution gaussienne pourvu que AN (té) > 10, 
avec « — 4Npg = VAN (t) (fig. 19). 


Notez que, dans cette expression, AN (t) n'est en 
général pas connuz. Dans le cas d'une mesure isolée, 


fig. 19 | 
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<« Figure 19 : 

distribution binominale 
que suit 

le nombre total 

de désintégrations 

d'un échantillon 

de substance radio-active. 


Fan CAR coLo® 


À Un exemple 
de visualisation des données 
statistiques. 


Figure 20 : 

le diagramme 

à deux dimensions (M, =); 
figure 21 : 

l'histogramme AW (m). 


Parimage - Caméra Press 


AN (ft) est remplacée par son évaluation AN (ft), confor- 
mément au principe de Bayes que nous étudierons 
ci-après. 

Finalement, considérons le cas encore plus général 
des statistiques de mesures où non seulement la valeur 
prise par la grandeur AC mais encore les précisions de 
mesure varient d'une mesure à l'autre, sans qu'aucune 
loi de variation pour les 4 ou les 3u ne soit connue à 
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l'avance. On supposera cependant que la précision de 
l'appareil de mesure utilisé pour la /-ième mesure, soit oi, 
est connue; cela veut dire que, considérant la /-ième 
mesure isolément, dont le résultat m; a été obtenu avec 
un appareil ayant la précision o:;, la probabilité a priori 
pour que la valeur réellement prise par A soit ui est, 
conformément au principe de Bayes : 


(83) 


[comparez avec (82)]. 

Toute l'information disponible dans une statistique de 
mesures de cette classe (que nous appellerons classe C3) 
est l'ensemble des paires (m:, c:) relatives à chaque mesure 
et à la précision avec laquelle cette mesure a été effectuée. 
Les (mi, ;) peuvent être considérés comme le résultat 
d'un tirage effectué sur deux variables aléatoires M et X, 
généralement corrélées, et régies par une distribution de 
probabilité à deux dimensions © (m, 0). 

La donnée des (mi, c;) constituant la statistique des 
résultats de mesure suffit, dans le cas de mesures gaus- 
siennes, à donner la totalité de l'information disponible 
quant à la séquence de mesures de M. Toutefois, présentée 
sous la forme banale d'une double liste de résultats de 
mesures et d'écarts types associés, cette information ne 
fait pas ressortir les traits essentiels de son contenu 
physique, et elle est peu commode, pour autant que le 
nombre de mesures effectuées soit assez important. 

C'est la raison pour laquelle on préfère, en général, 
présenter de façon plus condensée et plus suggestive 
les résultats de mesures, fût-ce au prix d'une perte plus 
ou moins importante d'information. 


Fu) = N (mi — ui, ci) 


Le diagramme (M, Y*) 

La présentation la plus naturelle de cette information 
est le diagramme à deux dimensions (M, X) (fig. 20); 
dans ce diagramme la /-ième mesure apparaît comme un 
point de coordonnées (m:, 6:). La densité de points dans 
ce diagramme, conformément à la première loi des grands 
nombres, tend vers la densité de probabilité + (m, o). 
Toutefois, cette représentation, bien qu'elle occasionne 
une perte minimale d'information (due uniquement à 
l'imprécision du dessin, etc.) reste peu suggestive. 


Liaison entre : (m, os) eto (u) 
En fait la distribution des résultats de mesures + (m, 6) 
est liée à la distributiono (1) par: 


(84) 5 (m, 0) = [o (u) x (o/u) N (m—u, 6) du 


car la probabilité d'obtenir pour résultat de mesure (m, 6) 
est, par suite de (3) et (4), égale à la somme des proba- 
bilités pour que AC prenne en réalité la valeur & multi- 
pliée par la probabilité 7 (5/1) de faire la mesure avec la 
précision 6, sachant que AC a pris la valeur , et multi- 
pliée par la probabilité d'obtenir le résultat m, sachant 
que AC a pris la valeur u et que la mesure est faite 
avec la précision o, cette dernière étant N (m —u, 6) 
d'après (82). 


Histogrammes 
Dans la limite où © est négligeable, 

e (m 5) & | o (u) à (o/u) S (m—u) du 

— @ (m) x (o/m) 
par (30). La distribution © (4) est simplement dans ce 
cas la distribution marginale de + (m,o). Cela nous 
conduit à une méthode simple, qui donne une bonne idée 
du spectre © (1) et qui est utile même dans le cas où 
les erreurs sont plus importantes: cette méthode consiste 
à diviser l'axe M du diagramme précédent en segments, 
ordinairement de même longueur, et à construire ce que 
l'on appelle l'histogramme AN (m) en portant le nombre 
de points contenus dans chaque intervalle en fonction 
de m (fig. 21). 

La présentation des résultats sous la forme d'un histo- 
gramme, quoique très simple et assez explicite, a deux 
inconvénients liés à deux sources de perte d'information : 

— nous savons quel est le nombre total de mesures qui 
donne un résultat dans chacun des intervalles Am, mais 
nous perdons la position exacte de chaque mesure à 
l'intérieur de ces intervalles ; 

— chaque mesure est traitée de la même manière, 
quelle que soit sa précision; l'information de cette 
précision est perdue. 


Afin de minimiser cette perte d'information, il convient 
de choisir pour taille des intervalles une longueur de 
l'ordre de oŸ, l'erreur moyenne commise dans les mesures. 
De cette façon, il y a une bonne chance pour que les u; 
correspondant aux mesures mm: appartenant au /-ième 
segment appartiennent aussi au même segment où aux 
segments immédiatement voisins. En outre, avec 
Am = 56), il est fort probable que les mesures se dis- 
tribuent de façon approximativement homogène au long 
de chaque segment. En effet, dans le cas extrême où 
la grandeur M prendrait chaque fois la même valeur u, 
on observerait une dispersion des résultats de mesure due 
aux erreurs de mesure, telle que les densités de points 
aux abscisses m = u + <oÿ et m = y sont, approxima- 
tivement, dans le rapport ei 0,61. La technique de 
l'histogramme, qui équivaut à supposer une répartition 
homogène des résultats de mesure le long de chaque 
segment, ne perd donc, en général, que peu d'information. 
Le choix de longueur de segment (le «bin » des Anglo- 
Saxons) indiqué plus haut est en définitive un bon compro- 
mis entre le désir de représenter de façon aussi immédiate 
que possible les données expérimentales et leur signi- 
fication, et le désir de ne pas perdre l'information dispo- 
nible. Néanmoins, le choix de l'intervalle peut être influencé 
par d'autres facteurs; notamment, quand la statistique 
de mesures est pauvre (les mesures peu nombreuses), 
il peut être préférable de prendre un intervalle de lon- 
gueur Am plus grand, soit pour mieux visualiser le spectre 
obtenu, soit pour se rapprocher dans chaque intervalle 
des conditions d'applications des lois des grands nombres. 


Idéogrammes 

La méthode des idéogrammes a l'avantage d'éviter 
la perte d'information inhérente à la méthode de l'histo- 
gramme, tout en restant très suggestive. Malheureusement, 
cette méthode conduit en général à des calculs peu 
pratiques. 

L'idéogramme gaussien, le plus utilisé, est par défini- 
tion la fonction aléatoire obtenue en remplaçant chaque 
point (m;, o;) du diagramme (M, ©) par une gaussienne 
N (m— mi, o;) et en faisant la somme de toutes les 
gaussiennes ainsi obtenues (fig. 22). 


(85) | (m) = È N (m— mi, 6i) 
ul 

Ainsi tient-on compte de l'abscisse exacte de chaque 
mesure m;, et également de la précision associée. On doit 
noter, cependant, que le choix de la fonction N (m—m:;, 6i) 
dans cette technique est assez arbitraire. Dans le cas 
d'une mesure isolée, cette distribution représente, d'après 
(83), la probabilité a priori pour que la valeur réelle de 
la grandeur AC soit m, mais la somme (85) n'a pas d'inter- 
prétation aussi simple. En définitive, sauf dans des cas 
très particuliers, l'utilisation des idéogrammes gaussiens 
ne présente pas d'avantages décisifs sur la technique, 
plus simple, des histogrammes. 


Problèmes d'estimation 


Dans le cas plus simple de statistiques de mesures 
gaussiennes répétées (c'est-à-dire faites dans les mêmes 
conditions sur le même système), les mesures se répar- 
tissent conformément à la distribution 


f (m) = 


obtenue en remplacant, dans (84), 


N (M — 0, 50) 


® (u) par à (u— Ho) et à (o/x) par à (os — oo). 
L'estimation de © (4) se réduit, dans ce cas, à l'esti- 
mation du paramètre 10. Une estimation correcte de 
uo est la moyenne arithmétique 4* 
1 
L — NZ 7 

pl 
En effet, u* est une variable aléatoire dont la limite, 
pour ñn —+ 00, est 49, conformément à la première loi des 


grands nombres. Par ailleurs, la variance sur u* est, 
d'après (35) : 


Cette variance coïncide avec la valeur déduite de la 
seconde loi des grands nombres : c'est la plus petite 
possible. On dit que À est la précision de l'estimation, 

En général 60 n'est pas connu, et pour évaluer À, on 
doit faire d'abord une estimation de o. La moyenne 
arithmétique des (m; — 40)? est, selon les lois des grands 
nombres, une estimation correcte de oo. 

Substituant dans cette expression 0, qui n'est pas 
connu, par 4”, on obtient une nouvelle variable aléatoire T 
dont l'espérance mathématique est : 


D = 9 (ma) 


TN Cm + N &u°2) — 2 N u°?)} 


= Km) — HD = 65 + Ho — N — Hô 
N=1 : 
= N 59 


où nous avons utilisé (34) et (24). 
Choisissons alors pour estimation de oo et À : 


N 1 
(88) Ten 2 ap 
i 


(mi — u°} 
LR (N—1) 


Considérons le cas plus général de statistique de mesures 
pour lesquelles © (4) prend encore la forme à (1 — uo), 
mais À (o/u)£ à (o— 00) (autrement dit, la grandeur { 
prend encore la valeur 4 à chaque mesure, mais la pré- 
cision dépend des conditions, variables, de la mesure). 
La formule (84) s'écrit dans ce cas : 


e (m, o) = À (o) N (m — Lo, 6), 


où nous écrivons } (5) au lieu de À (5/10), car 40 a une 
probabilité 1 de se produire. 

Le problème de l'estimation du paramètre 40 est dans 
ce cas plus compliqué. 

De nouvelles techniques nous aideront à trouver la 
solution. 

On peut noter, cependant, que l'espérance mathé- 
matique de M est 4 : 


{M — [ m2 (m, 5) dm do — 1 
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<« Figure 22 : 
l'idéogramme gaussien. 


uo est aussi la valeur plus probable de M. Dans la limite 
des grands nombres, les histogrammes (comme les idéo- 
grammes) correspondants atteignent par conséquent leur 
maximum au voisinage de m — uo. En outre, la distribu- 
tion À (o) est simplement, dans ce cas, la distribution 
marginale de 9 (m, 6): 


f(s)=[p(mo)dm=x (os) [N (m—uo. 6) dm = 2 (5) 


de sorte que l'histogramme des erreurs donne une esti- 
mation de À (o). 

Si l'on considère maintenant les classes plus générales 
de statistiques gaussiennes, du type C2 et C3, on s'aper- 
çoit que les raisonnements qui précèdent ne permettent 
pas d'obtenir à leur égard beaucoup d'informations sur la 
loi © (u) qui gouverne la variable AC. Il faut alors avoir 
recours à d’autres techniques, dites de test d'hypothèses, 
dont nous décrivons deux exemples (le y? et le maximum 
de vraisemblance) par la suite. 

Dans ces techniques, la question de déduire © (4) des 
distributions (M, Z) est supposée résolue : en partant 
d'une distribution +’ (u) choisie à titre d'hypothèse 
(a priori), on cherche à évaluer le degré de compati- 
bilité de cette hypothèse avec la distribution (M, ©) 
obtenue expérimentalement. 

La problématique est alors la suivante : étant donné que 
le résultat expérimental est ceci, quelle probabilité a-t-on 
pour que le résultat soit la conséquence d'un tirage selon 
la loi ©’ (4) plutôt que la conséquence d'un tirage selon 
æ” (4)? La réponse à cette question fait appel à ce que 
l’on appelle la probabilité des causes, et est fondée sur le 
principe de Bayes. 


Théorème de Bayes 

Soit À un événement physique dont la réalisation peut 
être la conséquence de l’une quelconque des causes 
(exclusives les unes des autres) B1, B2, …, BA sans que 
l'on sache avec certitude laquelle de ces causes (ou 
hypothèses) est responsable de la matérialisation de A. 

Appelons en outre Pr (B1), …, Pr (B2) les probabilités 
a priori pour que les causes B1, B2, …, B, soient présentes 
indépendamment de la réalisation ou non-réalisation 
subséquente de A. Pr (B; N À) est la probabilité pour 
que À se produise à travers la cause B;. Pr (A/B;) est la 
probabilité pour que À se produise, sachant que la condi- 
tion B; a été réalisée. Pr (B;/A) est la probabilité pour que 
l'antécédent B; se soit produit, sachant que l'événement 
A s'est effectivement réalisé. On a: 


Pr (B: N A) = Pr (B:) x Pr (A/Bi) 
— Pr (A) x Pr (Bi/A) 
par (3). D'où: 


(87) Pr (Bi/A) — L _ Pr (A/B:) 
Si B£ est une autre hypothèse : 
B 
(88) Pr (Bx/A) = ee. Pr (A/Bx) 


en faisant le rapport de (87) et (88) 
Pr (B;/A) _ Pr (B:) Pr (A/B:) 
Pr (Bx/A) Pr (Bx) (Pr A/Bx) 


(89) 


Si les causes B; et Bx sont a priori équiprobables : 


(90) Pr (B:/A) _ Pr (A/B:) 
Pr (Bz/A) Pr (A/Bx) 

En l'absence de toute information extérieure sur la pro- 
babilité a priori des diverses hypothèses B1, …, Br, on 
attribuera donc à chacune d'elles, en constatant que A 
s'est réalisé, une probabilité a posteriori proportionnelle 
à la probabilité pour que A se produise quand celle-ci 
est réalisée. En termes un peu abrupts, on dira que l'on 
choisit des probabilités des causes proportionnelles aux 
probabilités des effets. || ne faut pas oublier cependant que, 
si pour une raison quelconque extérieure à la réalisation 
actuelle de À, on ne considère pas les hypothèses 
B1, …, Br comme équiprobables à priori, c'est la for- 
mule (89) qu'il faut appliquer et non la formule (90). 

Si l'événement A ne peut survenir que par l'une quel- 
conque des causes B:; : 
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(91) Pr(A)= D Pr (B: NA) 
i=1 
par (4). D'où, en portant (91) dans (87) : 


Pr (B:) Pr (A/B:) 


(92) Pr (Bi/A) = 


D Pr (Bi) Pr (A/B:) 
i=i 


Soit C un autre événement, également susceptible de se 
produire quand la condition B; est réalisée. Évaluons 
Pr (C/A), probabilité pour que C se produise, sachant que 
A s'est produit : 


Pr (C/A)= © Pr (CN B;/A)= 
i=i 


D Pr (Bi/A) Pr (C/A N B:) 


i=1 


(93) 


par (3), en tenant compte du fait que l'une quelconque 
des hypothèses B est certainement valable. Portant (92) 
dans (93) : 


(94) Pr (C/A) = ! = 
D Pr (Bi) Pr (A/B:) 


Illustrons (94) par un exemple simple. Supposons que 
l'on ait trois urnes. L'une contient deux pièces d'or, 
la seconde une pièce d'or et une pièce d'argent, la troi- 
sième deux pièces d'argent. Pierre tire au hasard une pièce 
de monnaie dans une urne : c'est une pièce d'or (événe- 
ment A). Quelle est la probabilité pour que, en tirant la 
2° pièce de la même urne, celle-ci soit également en or 


(événement C) ? Ici N = 3. Pr (B;) — Eve. Pr (A/B1) = 1, 


1 


Pr (A/B2) = ; Pr (C/A 1 B1) = 1. Toutes les autres pro- 


babilités sont nulles. (94) donne alors : Pr (C/A) = 


GI ND 


Estimateurs 

Nous avons rencontré, au cours de cette section, 
plusieurs exemples d'estimation de paramètres (moyen- 
nes, variances, etc.) de la densité de probabilité © (x) 
attachée à la variable aléatoire A. 


D'une façon générale, on appelle estimateur ax du para- 
mètre « associé à la loi de probabilité © (u, «), le terme 
général d'une suite de variables aléatoires «*, …, af, tel 
que at est une fonction des K variables aléatoires 
Az … AGr, et prenant la valeur «* = f (u1,…,ux), con- 
siaérée comme valeur approchée de «. 

Par définition, on dit que «# estsans biaissiE (x#) — « 
et asymptotiquement sans biais si on a seulement 


lim E (xx) = «. Il est dit convergent en probabilité 
N—+ ü 
siVn>0, lim Pr{lxt — «| > n} = 0, et convergent en 
No s 


moyenne quadratique si lim E[|x*— 4}? 0. On peut 
> 00 

montrer qu'un estimateur convergent en moyenne qua- 
dratique est certainement convergent en probabilité. Enfin, 


l'estimateur est dit convergent au sens presque sûr si 


sauf pour un ensemble de probabilité nulle d'événements 
élémentaires possibles. 

Comme la convergence en moyenne quadratique, la 
convergence au sens presque sûr entraîne la convergence 
en probabilité. Le lecteur pourra s'assurer que les esti- 
mateurs que nous avons rencontrés (86) sont sans 
biais. On peut montrer qu'ils sont convergents au sens 
presque sûr. 


Tests d’hypothèses 


Le test de ;? 


La formule (84) : 
p (m, 6) = [o (u) x (o/u) N (m—u, 0) du 


relie la distribution des résultats de mesures, © (m, 6), 
à la distribution « vraie » de la grandeur physique AC, (u). 
Le passage de la première à la seconde implique, avant 
tout, la connaissance de la distribution des erreurs 


À (o/u). 


Dans un premier temps, nous allons supposer que les 
variables Z et M sont indépendantes (il est toujours 
possible de diviser le plan (M, 2) en régions de M, telles 
que, en chaque région, l'hypothèse de l'indépendance 
entre M et Z soit compatible avec les données expéri- 
mentales), de sorte que 


À (o/u) = À (o) 
où À (0) est la distribution marginale de 
à (o) = fo (m, os) dm 


Dans ces conditions, une évaluation correcte de À (o) 
est la distribution des erreurs telle qu'elle est observée 
dans les N mesures (mi, oi) : 


À" (o) = 2 b 5 (s— so 


de sorte que nous écrirons : 
(95) p(mo)# [eo (u) x" (o) N (m—u, 0) du 


A partir d'une distribution o’ (4) choisie à titre d'essai, 
nous pouvons alors calculer, moyennant (95), la distri- 
bution +” (m,6) se rapportant à o’ (u). Le test de y? 
a pour objet de nous permettre d'évaluer le degré de 
compatibilité entre la répartition obtenue expérimentale- 
ment et l'hypothèse +’ (m, os), en supposant que les 
(mi, 6i) obtenus sont le résultat d'un tirage de N événe- 
ments avec la distribution de probabilité £’ (m, o). La 
distribution o* (4) qui réalise la meilleure compatibilité 
est acceptée comme estimation de o (u). 


(m, 6) : 


Distribution de y? 
Par définition, le x? pour N variables aléatoires X, 
indépendantes, est donné par l'expression : 


=D 
i Î î 
Dans cette expression, X; et o; représentent l'espé- 
rance mathématique et la variance relative à X;. Les X; 
étant des variables aléatoires, le x? est une variable aléa- 
toire qui fluctue autour de la valeur moyenne : 


N Le Na 
<> a > se > N 
i=1 è 


d'après (22). 

La distribution de probabilité du 7? dépend de la forme 
des distributions de probabilités des X:. Si tous les X; 
suivent une distribution normale, nous avons : 


FX) = N (x — x, ci), 


(96) 


(97) 


et comme les X; sont indépendants : 
FX, XN) = f (x1) … f (x) = 


L sl % 


x)N/2 ; 
Crée | LE 


La distribution de y2 est, d'après (33) : 
ECS 


1 . (x — x}? | 
(2 7) /2 61 … [es [- > 2 o:? Il 


(xi — x}? | 
2 o;? Î 


À (GG — x) 
ÿ (2 > #2) X dx1… dx 
; o 
i=i îi 
Posant Ë; — ns 
i 


Ciccione - F 


(98) 


apho 


FES 
1 24e 7 
ere) IR 2 = À 
el: F (2-38) de ….dix 


et posant 72 = Ÿ £° 
? r 
PE St 
F(G)=cte | e ?5(2—7#)r dr 
J0 


car la somme (98) est étendue à tout l'espace à N dimen- 
sions d'une fonction constante sur la surface de la sphère. 
Cette surface est proportionnelle à 7“ -1: la constante 
sera identifiée ci-dessous en (100) Appliquant (31) : 


r 
5 S (x—r) A: 


ON Ë 
F()= cte | e 2 


dr 


ns 
cte —— SE 
2 2 2 


= —e 


La distribution de probabilité de 72 est donc une distri- 
bution G : 


(99) N—2 1 | 


FG= 6 3 


(voir 27). La constante de normalisation vaut : 


1E 
(100) Fe = ) 
70) 


d'après (28). 
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LÉGENDE 


À Les lois de probabilités 
permettent de se faire 
une idée des chances 

que l'on a de voir 
survenir telle ou telle 
conjoncture. 


» Figure 23 : 
voir développement 
dans le texte ci-dessous. 


» Figure 24 : le choix 
du degré de confiance 
est une question 

de rigueur scientifique. 


Richard Colin 


Les équations (29) donnent alors : 
x» = N 
en accord avec (97), et 
CS = 2N 


Le y? le plus probable (maximum de la densité de 
probabilité) est y£ — N — 2 (pour N > 2). Il ne coincide 
pas avec l'espérance mathématique {729 = N. 


Comportement asymptotique 
Le y? est une somme de variables aléatoires [les y? de 


l'expression (96)], qui sont toutes régies par la même 
distribution de probabilité : 


11 
S(-3z 2) 


pour laquelle l'espérance mathématique (7; = 1) et la 
variance (7; — 2) existent. La seconde loi des grands 
nombres nous donne alors le comportement asymptotique 
de la distribution de 7? pour les grandes valeurs de N : 


FC N GE N, VZN) 


En pratique, l'expression précédente est utilisée pour 
F (42) quand N > 30. 


Utilisation du ;? 

Soit w; (x) les distributions de probabilités se rap- 
portant aux X;: 

<xiD> = | xei(x) dx 
ci = | (x— xD où (x) dx 

À priori, nous pouvons prédire la probabilité pour que le 
72 (96) résultant d'un tirage sur les X; tombe dans l'inter- 
valle (2, y? + dy?). Cette probabilité est F (7?) dy?, 
donnée en (99). En particulier, si 7? est un nombre donné 
à l'avance : 


2 
PrG2 20 = |, F O0 dé (fig. 23) 
+“ Æ0 


Si la limite 72 est choisie telle que, par exemple, 
Pr (2 > 73) = 0,001, nous obtiendrons un y? > 73 seu- 
lement une fois sur mille tirages. L'éventualité que cela 
se produise dans un tirage unique est pratiquement exclue. 

A l'inverse, supposons les x; donnés et les ©; (x) 
inconnus. Si, à partir d'un choix &; (x) pris à titre d'essai, 
nous arrivons à une valeur de 7? qui dépasse 73 nous 
conclurons qu'il est pratiquement exclu que les hypo- 
thèses w; (x) soient les véritables distributions qui régis- 
sent les variables X;. On considérera comme possibles 
les familles 9! (x) qui mèneront à une valeur de 7? 
plus petite que 72; la famille ©; (x) qui mènera à la valeur 
de 7? la plus petite aura notre préférence et sera retenue 
comme estimation des ©; (x). 

Les familles exclues d'après le critère du 7? sont tou- 
jours exclues en probabilité. On dit que l'exclusion est 
faite au degré de confiance 1 — Pr (7? > y?) (= 99,9 % 
dans l'exemple choisi). Le choix du degré de confiance 
est une question de rigueur scientifique. En général on 
considère comme raisonnables des niveaux de confiance 
de 95 ou 99 %. Il faut noter que d'un autre côté nous 
devons nous méfier aussi des familles ; (x) qui condui- 
sent à des valeurs trop petites de 72, par exemple quand 
la probabilité d'obtenir un 7? plus grand que le 7? obtenu 
dépasse 98 %. En général, quand cela arrive, cela veut 
dire qu'en choisissant les o; (x) on a surestimé les 
variances 6? (fig. 24). 
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Application aux problèmes d'estimation 

Retournons aux problèmes d'estimation et servons- 
nous du critère du moindre y? comme critère d'estimation. 
Dans le cas de mesures gaussiennes répétées, les résul- 
tats de mesures se répartissent conformément à la distri- 
bution (82) : 


F(m) = N (m— 10, 60) 


Définissant le ;? comme: 


on a pour estimation de 40, au sens de la méthode du 
moindre 7?, la valeur ux donnée par: 

œë) 

| uo 


(101) 


u$ 


+ mi 
H=2N 


? 


Cette valeur coïncide avec l'estimation faite en s’aidant 
de la loi des grands nombres. 
Si les mesures ne sont pas faites avec la même précision, 


! 2 
2 2 5 (mi mo), 


La condition (101) admet pour solution : 


uÿ est la moyenne des m;, pondérés par les paramètres de 
us 1) 
récision [— ): 
P (x) 


La variable aléatoire 6 a pour espérance mathématique 
et pour variance : 


E (u$) = yo 


#0 (a) 


i î 


L'écart type & (5) nous donne la précision de l'esti- 
mation u$. 

Soit N le nombre total de mesures. La relation (101) 
définit une relation entre les N variables m:: de sorte que 
le 72 obtenu en identifiant 9 à LS ne doit pas se comparer 
à la distribution de 7? à N degrés de liberté, mais à la dis- 
tribution de 7? à N — 1 degrés de liberté. 

De façon générale, si les hypothèses o; (x) dépendent 
de certains paramètres inconnus #7; (k — 1, n),la méthode 
du moindre y? permet d'évaluer ces paramètres à travers 
les n relations : 


Richard Colin 


2-2 


mais le y? calculé avec ces 4% suit alors une distribution 
de’ y? à N — n degrés de liberté. 


Application aux histogrammes 

Le nombre N; de mesures (mi, 6;) tombant dans le 
j-ième segment de l'histogramme, est une variable aléa- 
toire. Sio (1) est la loi de distribution de la grandeur A, 
la probabilité pour qu'une mesure tombe dans l'inter- 
valle Am; est, d'accord avec (95) : 


I 


(102) »; 1. E (m, 5) dm do 
+ js 


(103) æœ o (4) À* (o) N (m—1, 6) du do 


| A m5, 0 


La probabilité pour qu'une mesure ne tombe pas dans 
le j-ième segment de l'histogramme est g;j = 1 — p;. 
D'autre part, chaque mesure est indépendante des autres, 
de sorte que le nombre total N; de mesures qui tombent 
dans le segment (j) de l'histogramme obéit à la distri- 
bution binominale avec les paramètres p; et g; donnés 
par (102) ou (103). En particulier : 

nj= E (N;) = Np; 
5j = 6 (N;) = VNp;g; 
où N est le nombre total de mesures. 

Écrivons le y? : 


(N— m5 
22 = 2 nr 
F 1 


On note que dans cette expression 6; est la variance 
relative à l'espérance mathématique n; et n'a rien à voir 
avec le nombre réel N; de mesures qui tombent effecti- 
vement dans le segment considéré. En dépit de la pratique 


courante, il est donc incorrect de substituer o; par N;, 
quand on veut comparer les distributions de y? avec 
l'expression (99). 

Le y? obtenu nous permet d'évaluer le degré de compa- 
tibilité d'une hypothèse donnée avec l'histogramme 
obtenu; l'hypothèse o* (4) qui minimise ce 7? sera, 
éventuellement, retenue comme estimation de © (1). 

Quelques réserves s'imposent cependant. On notera 
d'abord que, si nous avons / intervalles au total sur l'histo- 
gramme, les / variables N; ne sont pas réellement indé- 
pendantes; nous avons en effet la condition de « norma- 
lisation » : 


I 
> NN 
j=1 


qui lie les N; entre eux. Cette condition diminue le nombre 
de variables réellement indépendantes de / à /—1, 
de sorte que le 7? suit une loi de distribution à / — 1 degrés 
de liberté. 

La seconde observation est que, en toute rigueur, 
les distributions des N; ne sont pas gaussiennes, mais 
binominales, de sorte que la distribution (99) n'est pas 
strictement valide pour le 72. Toutefois, nous savons que 
la distribution binominale tend très rapidement vers une 
distribution gaussienne. L'erreur commise en se servant 
de la distribution de 72 (99) est négligeable, pourvu que 
tous les N; > 10 (fig. 10). Pour cette raison, on exclut 
généralement du calcul de y? les cellules d'histogramme 
telles que N; < 10. 


Extension au cas de variables corrélées 

Nous avons vu (62) qu'à partir d'un ensemble de 
N variables aléatoires X, centrées, gaussiennes et corrélées 
les unes aux autres, il est possible de trouver un ensemble 
de N variables aléatoires Ÿ gaussiennes, centrées, réduites 
et indépendantes. Il suffit pour cela que la matrice des 
variances V (61) soit régulière. 

Les Y sont reliées aux X par une transformation linéaire 
Y = AX. Dans cette transformation, la variable aléatoire 
unidimensionnelle 72 = XTV-1X est conservée : 


= YIW-IY = D y} car (AVAT)-1 = 1. 
î 


Cette variable aléatoire n'est autre que le y? défini en (96) 
pour les variables centrées et réduites. 

Soit donc X un ensemble de N variables aléatoires 
gaussiennes, admettant une matrice des variances V régu- 
lière. Le 72: É 

22 = IX — XIT V1 [X— X], 
suit donc une loi normale de 2? (99) à N degrés de 
liberté. 

Bien que ce résultat ne soit strictement valable que 
pour un ensemble de variables gaussiennes, le 72 défini 
de la même manière pour des variables aléatoires X 
suivant des lois proches de la loi normale (telles 
les populations des segments dans les histogrammes, 
pourvu que N; > 10) suit, de très près, une loi de 72 à 
N degrés de liberté. | 


Le maximum de vraisemblance 


Cette méthode de test d’hypothèse, introduite par 
Fischer, se base directement sur le théorème de Bayes (89). 

Soit ©’ (u) une distribution possible pour la grandeur 
physique AC, et ©” (1) une autre distribution également 
possible. Soit (mi, ci) la distribution expérimentale obser- 
vée dans le plan (M, £). Le théorème de Bayes (89) 
s'écrit dans ce cas: 


Pro" (u) / (mn, ci)} _ Pr{o" (u)} Pr{(mi ©) /œ° (u)} 
Pro" (u) / Cm oi} Pre” (u)} Pr{(m, oi) / ©” (u)} 
S'il n'y a aucune raison externe de privilégier l’une plutôt 


que l'autre des hypothèses +’ (1), ©” (u), les probabilités 
a priori de ces hypothèses sont égales : 


(104) Pro" Cu) / Cm ci)} | Pr{(mi oi) / @° (u)} 
Pr{o" Qu) / Con, c)}  Pr{(mr oi) / o° (u)} 
Les probabilités des hypothèses sont entre elles dans 
le même rapport que les probabilités d'obtenir la distri- 
bution (m;, o;) par un tirage sur ©” (4) et ©” (u) respec- 
tivement. 
Les épreuves (mi, 5) sont le résultat d'un tirage répété 
N fois sur la densité de probabilité + (m, 6) liée à © (u) 
par (84) ou (95). Ona: 


Pr{(m oi) / © (u)} = Pr{(mi, oi) / & (m, o)} = 
N 

(105) IT 5 (mi, ci) dm do: 

i=1 

par (3), chaque tirage étant indépendant des autres. 


Supposons que les hypothèses © (1) possibles dépendent 
d'un paramètre inconnu, que l’on cherche à ajuster, 


p(u)=9(u a), alors: 


e (m, 6) = p4 (m, 6). 


L'expression (105), où nous pouvons fixer arbitraire- 
ment les dm: et les do:, prend des valeurs variables selon 
la valeur de z. La fonction 


F (x) = A Pr{(m, 6i) / o (u, a)}, 


où À est une constante de normalisation, peut être 
considérée, conformément à (104), comme la distribu- 
tion de probabilité de x, sachant que la séquence des 
N tirages sur M, Y a donné les résultats (m:;, 6:). 
L'estimation 4* est donnée, dans la méthode du « maxi- 


: _ ©F 
mum de vraisemblance », par la condition Æ) «= 0; 
ox] 


cette condition peut aussi s'écrire : 
1 &F 
(F Ca/a«* 


(106) { = E Log F) . = 0. 


_ 
qui est plus facile à manipuler que la précédente (F n'est 
jamais strictement nulle, ne serait-ce que par suite des 
erreurs qui étendent le spectre des valeurs possibles de m 
de — © à + co). Compte tenu de (105), (106) s'écrit en 
effet : 


>| % 


(4 


[> Log px (mi, si) | — 0); 


La distribution F (x) est généralement caractérisée 
par son maximum «* et par sa variance 


= [(a—3)F (x) du (fig. 25). 
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» Figure 25 : 

la distribution F (x) 
est généralement 
caractérisée par 
son maximum «. 


Richard Colin 


Dans l’approximation où F (x) suit une distribution 


= 
c4\27 2 ©? 


La condition (106) donne dans ce cas 2° 
que la variance est donnée par: 


e à 
ae EE Log F @]., 


Cette relation est utilisée couramment pour définir la 
prévision de l'estimation «*, même quand F (x) n'est pas 
strictement gaussienne. On doit noter que, si F (x) est très 
éloignée d’une distribution normale, (107) perdtoutesigni- 
fication. Seule la donnée de la distribution F (x) dans son 
ensemble peut alors permettre d'interpréter correctement 
la précision de l'estimation &*. 


normale,ona:F (x) = 


%, tandis 


(107) 


Relation avec la méthode du ;? 

Maximum de vraisemblance et moindre 7? sont deux 
méthodes de test d'hypothèses équivalentes pour l'esti- 
mation de la moyenne d'une variable aléatoire dont la dis- 
tribution est normale. C'est en particulier le cas lorsqu'il 
s'agit d'estimer la valeur réelle 49 d'une grandeur phy- 
sique AC au moyen d'une suite de mesures gaussiennes 
répétées. En effet, si 


f(m) = N (m— u0, 50) 
ona: 
F (uo) = Pr (m1. mx/uo) = 


pb te 
ea: sp—2S (pri = of dm1 … dmx 
(sV27)S 2 . 
__ _ 1< (m—u} à ET 
Log F (uo) = —32 a — cte D: cte 
à Li : oy2 
Sie (£ HE) 0e (2) .— 
Cu.0 /Uo Gu0/ Ho 


L'avantage de la méthode de maximum de vraisem- 
blance est de permettre également d'évaluer la variance : 


N , 1 (Mm—u0) 
2 2 î 
Log F (5) 5 Log o5 22 un cte 
(Le F () Las 
05; S 

N 1 1 (mi — u0)? 
Dent ver p 
(Mi — yo)? 


soit Gi? N 


On comparera ce résultat avec (86) où uo a été remplacé 
par son estimation u*. 


Exemple d'application 

Considérons à titre d'exemple la détermination de la vie 
moyenne + d'une substance radio-active, dans les trois 
situations suivantes : la durée de l'observation Atest > 7, 
et les incertitudes sur les temps de désintégration sont 
négligeables par rapport à + [a] ; la durée de l'observation 
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est limitée, Af < + (cas des vies moyennes longues) [b]: 
les erreurs sur les temps de désintégration sont appré- 
ciables par rapport à + (cas des vies moyennes très courtes) 


[ce]. 
a - La densité de probabilité pour qu'un atome 
présent au temps t{ = 0 se désintègre au temps 8 est 


(108) o (6) = : er 6. 

Les erreurs sur les temps f; mesurés étant négligeables, 
nous écrirons À (5/8) — à (0), de sorte que nous pouvons 
écrire : 
fH=fer (0) de = 

À à 


| 


où nous avons utilisé (84). 
D'autre part : 


(109) at. E (a) N te 0 où dat = Led 
T 


N 
F (7) = A Pr (t1.…tw/T) = A 3 Le ls 
sl ” 
La condition du maximum de vraisemblance (106) 


donne alors : 
o 1 
T —= NS G 
l 


(110) 

La première loi des grands nombres assure en effet que 
eu r* — E (é) — 7, où E (é) est l'espérance mathé- 
N = 
matique de £, régie par la loi de probabilité (109). 

La précision de l'estimation +* peut être évaluée à l’aide 
de (107) : 

È e2 -1/2 ++ 
Oz = — = — NT 


Bien que F (+) ne soit pas gaussienne, cette Valeur est 
très proche de l'écart type de la variable +* définie par 
(110) ; en effet chacun des tirages #; est régi par la loi 


(108) égale à G (0, Le t) [donnée en (27)], dont le 


variance est o? — + d'après (29). La somme des #; admet 
donc pour variance N-+ d'après (35). 

b - Si la durée d'observation At est limitée, on doit 
substituer (108) par : 


1/5 e- 9/= 


ë 
1/7 e-8/7 d8 


Log F @)] 


23 eT 6/7 


AUS F re A7) 


définie sur l'intervalle O < 6 < At, ce qui entraîne, au 
lieu de (109), 


et/= 
FO = TT) 
A 


Ets 
Fes (1 — e- AW5)N 


€ 


L'estimation +*, solution de l'équation (106), est solu- 
tion de: 
e— Atir* 


at al Sir ni = 
— Ne +E4+ NA = 0 
Soit, au premier ordre en At: 
ns À | 2% 
T =p2t+Ate DZ 
ul 


c - Soit cola précision de mesure sur les instants des 
désintégrations. Portant X* (o) = 5 (s— ©) et utili- 
sant (95), nous avons, après intégration sur o : 


f (t) = 1fe-0r N (t— 8, co) dû 


A N 
D'où: F(-)=—+ I [e-6/N (&—6, co) dô 
"oi=i 


La solution +* de la condition de maximum de vrai- 
semblance (106) peut être recherchée par les méthodes 
de calcul numérique. Elles indiquent quelles corrections 
(petites) doivent être apportées à (110) pour tenir 
compte des erreurs de mesure. 


ee de M. de Fermat. =  - 4183. 


Table dontileff fsit mention dans la Lettre precedente. — 
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Éléments de théorie des jeux 


Introduction 


L'analyse des jeux de hasard (pile ou face, jeu de rou- 
lette, etc.) a joué un grand rôle dans le développement 
de la théorie de probabilités. Blaise Pascal, qui a défini 
de nombreux concepts de cette dernière, avait souvent en 
tête les questions que lui posait son ami le chevalier de 
Méré, joueur invétéré. Plus tard, la théorie des probabilités 
a largement dépassé ce champ d'application et est deve- 
nue une science mathématique fondamentale, en par- 
ticulier pour les sciences physiques. 

Les relations de la théorie des jeux avec les problèmes 
concrets de stratégie sont plus lâches. John von Neu- 
mann, le mathématicien hongrois qui, autour de 1928, 
a posé les bases de cette théorie, n'avait pas pour ambi- 
tion de définir la meilleure façon possible de jouer aux 
échecs ou au poker, mais d'analyser en termes logiques 
et mathématiques la situation à laquelle les joueurs 
d'échecs ou de poker sont confrontés, du fait de leur 
acceptation des règles de ces jeux. Les résultats obtenus 
par la théorie ne sont pas (sauf dans les cas les plus sim- 
ples) directement utilisables, en ce sens qu'ils ne dictent 
pas la conduite que tel ou tel joueur doit tenir dans telle 
ou telle situation concrète. Par contre, ils permettent 
d'établir parfois qu'il existe une méthode optimale pour 
jouer à ces jeux, en fonction des buts que le joueur cherche 
à atteindre. Par exemple, au jeu d'échecs, la théorie permet 
de démontrer qu'il existe une stratégie optimale pour cha- 
cun des deux joueurs, mais elle ne permet pas de décider 
concrètement quelle est cette stratégie. Si elle le faisait, 
d'ailleurs, le jeu perdrait tout intérêt, car le résultat de la 
partie serait connu des deux joueurs avant même que 
celle-ci commence. 

Cependant, de même que le champ d'application de la 
théorie des probabilités déborde largement les jeux de 
hasard, celui de la théorie des jeux déborde largement le 
cadre des jeux dont les résultats se comptent en points 
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ou en argent gagnés ou perdus. En tant que théorie de 
l'analyse logique et mathématique des situations conflic- 
tuelles, tenant compte des résultats désirés ou redoutés 
par les partenaires, elle peut être utile pour éclairer les 
décisions des hommes politiques, des stratèges mili- 
taires, ou des hommes d'affaires placés en situation de 
concurrence. Ce n'est donc sans doute pas par hasard 
que cette branche des mathématiques a connu un vif 
développement après la Seconde Guerre mondiale, dans 
le climat de la guerre froide. Dans un tel climat, la pos- 
session des armes absolues que l'on sait faisait que les 
problèmes de décisions stratégiques avaient pris le pas 
sur les problèmes d'équipement militaire. 

La théorie des jeux est donc une théorie de la décision 
formelle. Les circonstances dans lesquelles ces décisions 
doivent être prises peuvent englober une part de hasard 
(le risque), comme dans le jeu de poker, mais ce n'est 
pas toujours le cas. Dans de nombreuses situations, 
au contraire, l'effet de toutes les décisions possibles est 
connu avec précision, et une seule d'entre elles produit 
le meilleur résultat recherché. 11 faut donc se garder de 
confondre la théorie des jeux avec celle des jeux de hasard. 
Cependant, comme on le verra, même dans les situations 
conflictuelles complètement déterminées, les joueurs ont 
parfois intérêt à introduire un élément d'incertitude en 
variant, d'une partie à l’autre et de façon aléatoire, la straté- 
gie qu'ils choisissent. Par ce biais, la notion de probabilité 
est alors réintroduite dans leur jeu. 

Notons enfin que, puisque la théorie prend en compte 
non seulement les données (règles du jeu) de la situation 
en question, mais aussi les résultats désirés ou redoutés 
par les joueurs, selon un ordre de préférence qui peut être 
subjectif, la théorie ne vise pas toujours à déterminer un 
comportement rationnel des joueurs, au sens où ce com- 
portement serait dicté uniquement par des considérations 
objectives. Ce fait nous retient de parler, à propos de la 
théorie des jeux, de théorie de la décision rationnelle, et 
rapproche la théorie des jeux des sciences sociales et de la 
psychologie. 
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À A gauche, 

cette page, tirée 

d'une édition de 1679 

sur les travaux de Fermat, 
reproduit la table jointe 

à une lettre envoyée 

à ce même Fermat 

par Pascal, dans laquelle 
il l'entretient de questions 
relatives aux probabilités 
dans le jeu de hasard. 

A droite, au jeu d'échecs, 
la théorie ne 

permet pas de décider 
concrètement quelle est 
la stratégie optimale 
pour chacun des 

deux joueurs. 


Richard Colin 


y Figure 26 : 

les 23 configurations 
finales possibles 

au jeu de tic-tac-toe. 


Utilités 


Afin de théoriser les problèmes de stratégie, il est 
nécessaire, non seulement de bien connaître les règles 
du jeu, qui fixent les conséquences de chacune des 
décisions des joueurs et le moment où le jeu s'arrête, 
mais encore de chiffrer son résultat, ou, comme on dit, 
le règlement. Les règlements attribués en théorie des 
jeux à tel joueur ne correspondent pas nécessairement 
à des sommes perdues ou gagnées. Ce peut être + 1 pour 
« gagné », — 1 pour « perdu » et O pour « match nul », 
mais aussi n'importe quelles autres valeurs. Il se peut, 
par exemple, que d'un point de vue psychologique, le 
joueur estime qu'il est plus dommageable pour lui de 
perdre qu'il n’est avantageux de gagner. Il affectera alors 
au règlement de la situation « perdu » une valeur — a, 
a > 1, ou bien au règlement de la situation « gagné » 
une valeur b, b < 1. On suppose généralement, en 
théorie des jeux, que les règlements sont définis sur une 
échelle relative, c'est-à-dire que n'importe quel change- 
ment d'échelle du type y — ax — b n'affectant pas les 
préférences relatives des joueurs n’affecte pas les décisions 
de ceux-ci. Dans ce cas, on désigne les règlements sous 
le nom d'utilités. Les utilités sont donc définies à une 
transformation linéaire près. Il est toujours possible de 
choisir arbitrairement les utilités O et 1, et les autres utilités 
sont alors fixées comme dans l'exemple ci-dessus, par 
les appréciations relatives des autres résultats possibles 
du jeu. 
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Naturellement, le résultat recherché par le joueur, à. 
l’aide de la théorie des jeux, sera de maximaliser l'utilité. 
Dans les situations dans lesquelles le hasard intervient, 
on choisira de maximaliser l'espérance d'utilité, au sens 
de la théorie des probabilités (19). Ce choix ne repré- 
sente pas nécessairement un comportement rationnel 
(maximalisation du gain final), sauf dans l'hypothèse 
où les joueurs jouent un grand nombre de parties succes- 
sives. Supposons, pour fixer les idées, que le joueur doive 
tirer un billet de loterie de l’un des deux chapeaux A et B 
disposés devant lui, et qui contiennent chacun 20 billets. 
Dans le chapeau À, 2 billets donnent droit à 100F,4à5F, 
4 sont vides, 4 donnant une amende de 5 F et 6 une 
amende de 10 F. Dans le chapeau B, 1 seul billet donne 
droità 100F,6à5F, 5 sont vides, 4 donnant une amende 
de 5 F et 4 une amende de 10 F. En termes d'espérance 
d'utilité, tirer un billet du chapeau A (espérance de gain 
de 7 F) est deux fois meilleur que tirer un billet du cha- 
peau B (espérance de gain de 3,5 F). Cependant, en une 
partie, le résultat le plus probable est de perdre 10 F avec 
le premier billet et de gagner 5 F avec le second : un 
homme prudent pourrait donc préférer cette deuxième 
solution. 

Les utilités affectées à tel ou tel résultat par chacun 
des joueurs ne sont pas nécessairement les mêmes, l'ordre 
des préférences ou les rapports entre ces préférences 
pouvant différer d'un joueur à l'autre. Une classe parti- 
culièrement importante de jeux, cependant, est celle des 
jeux à deux personnes de somme nulle, pour lesquelles les 
utilités affectées par l'un des joueurs (tels les gains et les 
pertes) sont égales et opposées à celles affectées par 
l'autre joueur. Sauf exception, nous ne traiterons dans ce 
qui suit que de situations rentrant dans ce cadre. 


Stratégies 


On appelle stratégie l'énoncé de la conduite d'un joueur, 
compte tenu de chacune des réactions possibles de 
l'adversaire à chacun des coups qu'il joue. 

Le déroulement d'une partie et son utilité sont déter- 
minés, dans un jeu à deux personnes, par un couple de 
stratégies : celle du joueur, et celle de l'adversaire. 

Il ne faut pas confondre le nombre de stratégies et le 
nombre de déroulements possibles d'une partie. Considé- 
rons, pour fixer les idées, le jeu de tic-tac-toe. Ce jeu, 
qui se joue sur un damier 3 x 3 cases, consiste, pour le 
joueur À, à essayer d'aligner 3 croix, pendant que son 
adversaire B essaie, de son côté, d'aligner 3 ronds. 
Chacun des joueurs place alternativement une croix 
ou un rond, en commencant par une croix (fig. 26). 
Quand « A» a placé 5 croix, et « B » a placé 4 ronds, 
le damier est entièrement rempli. Nous supposerons, pour 
simplifier, que les joueurs décident de toujours poursuivre 
la partie jusqu'à compléter le damier, et ne s'arrêtent 
pas, comme c'est l'habitude, dès que l’un d'eux a aligné 
trois signes. 


! 
Un — 126 manières distinctes de remplir le 
damier, et 9! — 362 880 déroulements possibles d'une 
partie. 

Numérotons les cases de 1 à 9. Une stratégie possible 
pour À consiste à décider : « au premier coup, je place 
une croix dans la case 1; au troisième, si B a rempli la 
case 2, je placerai une croix en 3; s’il a rempli 3, je placerai 
une croix en 4... s'il a rempli 9, je placerai ma croix en 5. 
Au cinquième coup, etc. » Étant donné que B a 8 choix 
possibles (de 2 à 9) au deuxième coup, et que dans cha- 
cune de ces alternatives À peut décider de placer sa 
marque dans l’une quelconque des 7 cases libres, le 
nombre de stratégies possibles au troisième coup est 75. 
De même, au cinquième, il est de 56, et au septième, 
de 34, Au neuvième coup, il n'y a qu'une stratégie possible, 
celle de placer sa croix dans la seule case restée libre. 
Au total, le nombre de stratégies possibles pour l'ensemble 
de la partie est : 


9 x 78 x 56 x 34 6,6 1015. 


Il y a 


Tous ces nombres sont, en réalité, surévalués car il est 
raisonnable de considérer comme équivalentes toutes les 
figures qui ne diffèrent que par une symétrie par rapport à 
un bord du damier ou par une rotation de 90°. Ainsi, compte 
tenu de ces symétries, le nombre de manières distinctes de 


remplir le damier tombe de 126 à 23, et le nombre de 
déroulements possibles tombe de 362 880 à 


23 X 5! X 41 — 66 240. 


Le nombre de stratégies possibles est donc, en général, 
très grand, même pour les jeux les plus simples. Si grand 
que soit ce nombre, cependant, il ne peut être infini, à 
partir du moment où le nombre de coups possibles et le 
nombre de choix à chaque coup restent finis. 

Dès que chacun des joueurs a choisi une stratégie, le 
déroulement de la partie devient inéluctable. Si le joueur 
ignore la stratégie choisie par son adversaire, il ne peut 
prédire le résultat de la partie, mais un observateur qui 
saurait quel couple de stratégies a été choisi pourrait le 
faire. On peut donc associer à tout couple de stratégies 
(4, j) un résultat, ou une utilité, que nous désignerons par 
U;;. La matrice U;;, où / varie de 1 à n (nombre de stra- 
tégies possibles pour le premier joueur) et / de 1 à m 
(nombre de stratégies possibles pour le deuxième), est 
appelée matrice de jeu. 


Stratégies dominantes et minimax 


Considérons, dans un jeu à deux personnes de somme 
nulle, l'ensemble des stratégies possibles A; pour le 
joueur A et l'ensemble des stratégies possibles B; pour B. 
Soit U;; la matrice de jeu. 

Comparons deux stratégies possibles pour À, soit Az 
et Ar. Si les utilités procurées par Az; sont supérieures ou au 
moins égales à celles procurées par À, quelle que soit la 
stratégie B; choisie par B, on dit que A; domine A. 
Si Ax domine toutes les autres stratégies A1 £ Az, 
A& est une stratégie dominante. 

On peut distinguer des jeux pour lesquels : 

— il existe une stratégie dominante pour chacun 

des joueurs; 

— il n'existe de stratégie dominante que pour l'un 
des joueurs; 

— il n'existe pas de stratégie dominante. 

Dans le premier cas, la conduite à tenir pour les joueurs 
A et B est évidente : ils choisiront chacun la stratégie domi- 
nante correspondante. Le résultat du jeu est déterminé 
par ce choix. 

Dans les deux autres cas, le choix des joueurs n'est 
pas évident. 

Cependant, chaque stratégie A; offre des utilités U;; 
variables selon la stratégie choisie par l'adversaire. Consi- 
dérons la plus mauvaise d'entre elles : 


U; = Min (Usz, … Uin). 


En l'absence de stratégie dominante, un joueur avisé A 
(et qui suppose que son adversaire saura profiter de 
toute imprudence de sa part) choisira la stratégie Az 
qui assure le meilleur résultat parmi les plus mauvais 
U*x; = Max (U*1,., U*»). Tout autre choix laisserait à B 
la possibilité de lui infliger un résultat plus défavorable. 
Son adversaire, B, appliquera naturellement la même 
tactique. Finalement, les joueurs À et B choisiront un 
couple de stratégies correspondant à un co/ (le col est 
un point le plus bas dans une ligne horizontale de la 
matrice de jeu, et un point le plus haut dans la ligne verti- 
cale correspondante). On l'appelle aussi un minimax. 

Si Uxr et Umn sont deux cols, alors ils ont même 
valeur, et Uxzr et Uni sont également deux cols de même 
valeur : n'importe lequel de ces couples de stratégies 
produit donc la même utilité. En effet, par définition des 
cols, on peut écrire : 

Ur > Uni > Un 
Uzi < Üzn < Urnn 
D'où Ur = Uni = Umn = Uxn (fig. 27). 

Le principe minimax selon lequel les joueurs doivent 
choisir un col de la matrice de jeu, s'il en existe, constitue 
donc la règle à suivre pour tous les jeux à deux personnes 
de somme nulle. 

Tous les jeux à information parfaite (c'est-à-dire dans 
lesquels les décisions prises par l'adversaire au coup 
précédent sont connues du joueur, et pour lesquels, par 
conséquent, le hasard ne joue aucun rôle) présentent des 
cols. En effet, considérons les deux derniers coups joués, 
et supposons, pour fixer les idées, que ceux-ci sont 
joués successivement par A (n alternatives) et B (m alter- 
natives). La matrice de jeu correspondant à ce sous-jeu 
à deux coups possède n lignes et m” colonnes. Parmi 
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< Figure 27: 
voir développement 
dans le texte ci-contre. 


Y Le jeu de Go. 

Tous les jeux 

à information parfaite, 
présentent des cols. 


-E. Pasquier - Rapho 


h 


>> À gauche, figure 28 : 
représentation 

du règlement des joueurs 
au bouton 

(voir texte ci-dessus). 

A droite, figure 29 : 
l'existence d'une stratégie 
mixte optimale est 

une propriété générale 
des jeux à deux personnes 
de somme nulle. 


ces m? colonnes, il en existe toujours au moins une qui 
regroupe tous les minimums correspondant aux n lignes. 
La stratégie correspondante peut être en effet reformulée 
ainsi : choisir l'alternative qui conduit au minimum de 
gain pour A. Par définition, le maximum de ces minimums 
est un col. Il est donc superflu de jouer ces derniers coups, 
dont le résultat, pour des joueurs avisés, est connu 
d'avance. Le jeu se trouve donc ramené à un jeu amputé 
de deux coups, et ainsi de suite. 

Dans la pratique, les dimensions des matrices corres- 
pondant aux jeux réels sont le plus souvent telles qu'il est 
impossible d'expliciter les stratégies qui conduisent à des 
cols. C'est ce qui permet aux jeux à information parfaite, 
tels que le jeu d'échecs, de garder un intérêt car, dans le 
cas contraire, toutes les parties de jeux d'échecs disputées 
par des joueurs avertis aboutiraient au même résultat (ou 
à des résultats équivalents en termes d'utilités). 


Stratégies mixtes 


Les jeux ou les situations conflictuelles à information 
parfaite sont exceptionnels. Dans la plupart des situations 
concrètes, les adversaires ont la possibilité de cacher l'un 
à l'autre une partie des décisions qu'ils prennent au cours 
de la partie. Les décisions tenues secrètes par le joueur B, 
par exemple, empêchent le joueur A d'envisager un 
comportement différent selon ces décisions. Par rapport 
au jeu à information parfaite où toutes les décisions sont 
connues, le nombre de stratégies possibles pour A s'en 
trouve diminué, et la matrice de jeu réduite. Cette matrice 
réduite peut encore, éventuellement, présenter un col, 
mais il arrive fréquemment qu'elle n'en présente plus. 

Illustrons ces considérations par un exemple simple. 
Considérons le jeu suivant : A met dans sa main ouverte 
(droite ou gauche) un bouton, puis B fait de même. Les 
joueurs comparent alors leurs mains, et le règlement 
s'établit selon le schéma suivant (fig. 28) : 

A a le choix entre deux stratégies, 

« D » et « G » (choisir la main droite ou la main gauche). 

B a le choix en quatre stratégies : 


1 choisir d quel que soit le choix de A 
2 choisir d si D et g si G 
3 choisir g si D et d'si G 
4 choisir g quel que soit le choix de A. 


La matrice de jeu correspondante est donc : 


|1/|21]3])41] 
b | # | à lai | 4 
| él es ETS 


Elle comporte, comme prévu, un col en D3, de valeur—1. 
Le joueur A doit mettre le bouton dans la main droite 
(pour ne pas risquer de perdre 2 points) et B doit le mettre 
dans la main gauche pour gagner 1 point. 

Ce jeu est évidemment dépourvu d'intérêt. Examinons 
donc la variante selon laquelle A, au lieu de mettre le 


à 
S+3 


choix 
de réglement 


Richard Colin 
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bouton dans sa main ouverte, garde sa main fermée et 
ne l'ouvre qu'une fois que B a fait son propre choix. 
Les stratégies possibles pour A restent les mêmes, mais 
les stratégies 2 et 3, pour B, n'ont plus de sens : 
les seules possibilités qui s'offrent à lui sont de choisir 
lui-même soit de placer le bouton dans la main droite, 
soit dans la gauche. La matrice 2 X 2 correspondant à 
ce nouveau jeu est : 


RACE 


Si A joue une seule partie, son comportement dépen- 
dra essentiellement de son caractère. S'il est audacieux, 
il cachera le bouton dans la main gauche, espérant que B 
fera de même. S'il est prudent, il préférera le cacher dans 
la main droite, pour ne pas risquer de perdre plus d'un 
point. 

Dans un jeu répété un grand nombre de fois, À ne peut 
pas adopter toujours la même stratégie. S'il le faisait, 
B aurait tôt fait de le remarquer et d'adapter sa propre 
stratégie de façon à gagner. Ainsi, si À choisissait de 
toujours cacher le bouton dans la main gauche, B choisi- 
rait toujours la droite et À perdrait 2 points à chaque partie. 
Pour confondre son adversaire, À doit donc choisir 
tantôt une stratégie, tantôt une autre; et pour être sûr 
que B ne risque pas de deviner son choix, il changera 
de stratégie de façon aléatoire, tirant au sort entre la stra- 
tégie D, à laquelle il affectera la probabilité x, et la straté- 
gie G (probabilité 1 — x). Bien entendu, B fera de même, 
affectant la probabilité y à la stratégie 1 et 1 — y à 
la stratégie 4. 

L'espérance d'utilité, dans ce cas, est : 


E=2xy—=x (1m) 2 (T0 + 

3 (1— x) (1—7y) = y (8x—5) —4 x + 3. 
5 
8 
l'espérance d'utilité, E = 


Pour x — —, la fréquence y choisie par B n'affecte pas 


1 . 
3: En choisissant cette valeur 


de x, À est donc assuré, à la longue, d'obtenir un demi- 
point par partie (en moyenne). 


D'autre part, E = x (8y— 4) — 5 y + 3. Pour y = : 
la fréquence choisie par A n'affecte pas non plus l'espé- 
rance d'utilité, E — ; Il est facile de montrer que le couple 


de fréquences (x = à y — 5) est celui qui conduit au 


meilleur résultat possible à la fois pour A et B. Par exemple, 


bre 5 due st 
si À choisit x > g B peut réagir en choisissant y < 5 


ce qui assure une espérance d'utilité inférieure à 5 (fig. 29). 
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Le couple de fréquences (x = : y = :) est appelé, 
dans ce cas, la stratégie mixte optimale, et l'espérance 
de gain associée, E = : est appelée va/eur du jeu. L'exis- 
tence d'une stratégie mixte optimale (ou de plusieurs 
stratégies mixtes optimales de même valeur) est une pro- 
priété générale des jeux à deux personnes de somme nulle. 
Si la matrice de jeu possède un col, ce col est un cas par- 
ticulier de stratégie optimale (pour lequel les fréquences 
affectées sont 1 et 1). Comme dans le cas des cols, cepen- 
dant, il est le plus souvent impossible de résoudre en 
pratique le problème de déterminer quelle est ou quelles 
sont la ou les stratégies mixtes optimales correspondant 
à une situation concrète. 

Examinons les conditions que la stratégie mixte opti- 
male d'un jeu à deux personnes de somme nulle doit 
remplir. Appelons Ui; les éléments de la matrice de jeu à 
n lignes (stratégies A1 … An) et m colonnes (stratégies 
B1 … Bm). Les probabilités affectées par B aux stratégies 
A1 … An sont x1, …, Xn, et les probabilités affectées par B 
aux stratégies B1 … Bm Sont y …, Ym. L'espérance d'uti- 

n m 
E = À U; Xi Yi. 
i=1j=1 

Quelle que soit la stratégie choisie par B, l'espérance de 
gain de A doit être au moins égale à la valeur du jeu, 
soit v. Par conséquent, pour chaque m: 


lité est: 


n 
(111) > Uÿ; x; > v (m inéquations). 
i=1 
D'autre part, les x;, étant des probabilités, doivent satis- 
faire les relations : 


x > 0 


n 
> x=1 
i=1 


De même, les relations auxquelles doivent satisfaire les 
y sont : 


(n inéquations) 


(112) 


(113) >. Üi; ys < v  (ninéquations) 


F: — VU >—v 
j=1 


y; > O (minéquations) 


équivalentes à 


(114) et 


La résolution des systèmes d'inéquations (111) à (114) 
peut se faire par approximations successives. 

Notons enfin que, dans le cas simple où 7 = m = 2, 
la résolution du problème de stratégie optimale est immé- 
diate, en utilisant la propriété, remarquée dans l'exemple 
du jeu de bouton-bouton, que, au point x*, y* cherché, 


grad E est nul (l'espérance d'utilité ne dépend ni de la 
valeur de x, pour y = y* fixé, ni de la valeur de y, pour 
x = x* fixé). 

êE 
y 

Si nous écrivons la matrice de jeu sous la forme : 


; ; ©E 
Ce point est donc solution de An 


| 8 | 8 


(115) Pr 


A1 x 


A2 |1—x 


l'espérance d'utilité est : 


(116) E— axy + bx (1 — y) + cy (1 — x) 
+ d(1—x) (1 — y) 
| Œ _ & | 
et: nl: Data 


: d—c 
(a+ d)— (b+ oc) 
d—b 

(@+ d)— (b+ c) 

On pourra vérifier sans difficulté que, si la matrice ne 
possède pas de col, le point (x*, y*) se trouve bien dans 
le caréO<x<1et0<y<« 1. 

Nous avons considéré jusqu'ici des jeux à deux per- 
sonnes de somme nulle dont les joueurs, connaissant 
parfaitement toutes les règles du jeu, peuvent construire, 
au moins en principe, la matrice de jeu. L'examen de 
celle-ci dicte alors leur conduite. Cependant, dans les 
situations de conflit réel, il n'est pas rare que les règles 
du jeu échappent, au moins en partie, aux joueurs, qui 
ne peuvent apprécier qu'après coup le résultat global 
des stratégies qu'ils choisissent et comparer leurs diffé- 
rentes efficacités — c'est-à-dire leurs différentes utilités — 
au terme d'une longue suite ou répétition de parties. 

Pour examiner quel peut être, dans cette situation, le 
comportement des joueurs, reprenons l'exemple simple 
du jeu à deux personnes de somme nulle qui ne présente 
que deux stratégies possibles, à la fois pour A et B. La 
matrice de jeu est de la forme (115). Si elle présente 
une stratégie dominante ou un col, un examen empirique 
des résultats acquis au cours d’un nombre suffisant de 
parties aura tôt fait de convaincre les joueurs de l'existence 
de cette stratégie dominante ou de ce col. Dans ce cas, 
en effet, l'attitude des joueurs est déterminée sans ambi- 
guiïté : ils doivent appliquer les stratégies correspondantes, 
qui leur assurent le maximum de gain sans risque. 

Dans le cas d'un jeu dont la matrice ne présente pas de 
col, toutefois, la situation est différente : les joueurs doivent 
appliquer une stratégie mixte dont les probabilités asso- 
ciées, x” et y”, ne peuvent être évaluées que s'ils connais- 
sent la matrice dans son ensemble. Au cours des pre- 
mières parties, ils se fixent donc a priori une stratégie mixte 
caractérisée par les probabilités x et y. Celle-ci leur assure, 
en moyenne, une utilité donnée par (116). Au bout d'un 
certain nombre de parties, le joueur A peut essayer d'amé- 
liorer son gain en modifiant la probabilité x associée à la 
stratégie A1. Si l'utilité moyenne obtenue avec cette 
nouvelle stratégie mixte est plus élevée, il en déduit logi- 
quement qu'il a eu raison de modifier, dans cette direc- 
tion, la probabilité x et la modifiera encore, jusqu'à opti- 
misation de son gain. 

Naturellement, pendant ce temps, le joueur B fera de 
même. De plus, il est naturel de supposer que chacun des 
joueurs changera d'autant plus souvent, ou d’autant plus 
fortement, la probabilité x (pour A) ou y (pour B) que 
l'amélioration du gain obtenu lors de la dernière série aura 
été plus forte. Au total, leur comportement sera conforme 
à ce que l'on appelle un modèle dynamique de jeu, que 
l'on peut caractériser par le système d'équations : 


* 


X 
(117) 


* 


ÿ 


d& _ LE 
dt êx 
(118) dy _ _ pe CE 
dt êy 


où les constantes positives «2 et 82 mesurent l'intensité 
avec laquelle les joueurs A et B réagissent aux améliora- 
tions obtenues en variant les paramètres des stratégies 
mixtes qu'ils appliquent. La 2° équation (118) comporte 
un signe —, du fait que si le gain de A est E, le gain de B 
est — E. 

Explicitant ces équations à l'aide de (116), le système 
(118) se réduit au système d'équations : 


de 
He Y + 
d 
= — x — 8 
où u—=a@(a+d—b—c), v= «2(b—d), 
n=B(a+d—b—c), 8= B2(c— d). 


Ce système admet pour solution : 
x = À cos ot + B sin œt + x* 


* 


y = £ [8 cos wt— À sin ct] + y 
L4 
où les x*, y* sont donnés par (117) et «© — un. Les 


partenaires choisissent des stratégies mixtes qui, au cours 
du temps, décrivent dans le plan (x, y) une ellipse centrée 
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» Figure 30 : 


les partenaires choisissent 


des stratégies mixtes 
qui, au cours du temps, 
décrivent une ellipse 
centrée sur x° et Y’, 
couple de stratégies 
mixtes optimal. 


Y Figure 31 : 
diagramme du jeu 

avec entente 

(voir développement 
dans le texte ci-contre). 


rer soemene 
chéisi abemps æ e) 
| 
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sur x° et y”, couple de stratégies mixtes optimal (f#g. 30). 
Cette ellipse est décrite avec une vitesse angulaire uni- 
forme. Si le point initial n’est pas trop éloigné du point 
x*, y”, de telle sorte que l’ellipse est décrite dans son entier 
sans sortir du carré 0 < x < 1,0 < y < 1,le gain moyen 
obtenu par les deux joueurs au long d'un cycle complet 
sera le même que s'ils avaient choisi dès l’abord le couple 
optimal x*, y*. 


Jeux de somme non nulle; ententes 


Pour conclure ce rapide examen des principes fonda- 
mentaux de la théorie des jeux, examinons quelques cas 
de jeux à deux personnes de somme non nulle, c'est- 
à-dire tels que les utilités attribuées à chaque résultat 
par les deux joueurs ne sont pas exactement oppo- 
sées. Ce sera le cas, par exemple, si les préférences des 
joueurs ne sont pas rangées par chacun d'eux dans le 
même ordre avec les mêmes poids relatifs, ou si le règle- 
ment attribue des gains différents à chaque joueur, par le 
truchement d'une « banque », de telle sorte que ce qui 
est gagné par À n'est pas nécessairement perdu par B. 

Dans ce cas nous n'avons plus affaire à une matrice de 
jeu, mais à deux : la matrice des utilités évaluée du point 
de vue de A, et celle évaluée du point de vue de B. L'atti- 
tude face à ces jeux sera illustrée par un exemple simple. 
Supposons que la matrice de jeu pour le joueur A soit 
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la matrice Ü:, tandis que pour le joueur B elle est U> : 
B1 | B2 | Bi | Be | 
à | SE | 1 M = | à 
A2 — 2 | 3 A2 2 — 1 
Ur U» 


Si le jeu était de somme nulle, A aurait intérêt à appliquer 
la stratégie mixte caractérisée par la fréquence x* — 8 
solution de la première des équations (117). De même, 
B aurait intérêt à appliquer la stratégie mixte caractérisée 


5 
par la fréquence y* — g Dans le cas où A et B appliquent 


ce couple de stratégie mixte, l'espérance de gain pour A 
est : 


25 20 15 12 1 
ES (r2)-z 1) 75 ( 2) 75 ( 3) 5 
tandis que pour B elle est: 

25 20 15 12 2 
EB 75 ( 2) 32 ( 4) 75 ( 2) 75 ( 1) 3 


Cependant, il est facile de se rendre compte que les 
joueurs A et B ont intérêt à s'entendre. 

Supposons, par exemple, qu'ils décident de partager 
leurs gains. Dans ce cas, leur entente qui est totale a pour 
effet de remplacer chacune des matrices de jeu Ui et U 
(U1 + Ub). 

5 ; 


par la matrice U3 — 


telle que A choisit certainement la stratégie dominante Ai 
et B la stratégie dominante B2. Le couple (A1, B2) assure 


à chacun un gain de 5 


: , 5 ° 
de gain de 1 point pour A et de 6 de point pour B par rap- 


par partie, soit une amélioration 


port à ce qu'ils pourraient attendre d'un jeu sans entente. 

Naturellement, B pourra faire valoir que ce partage 
des bénéfices de l'entente est injuste, et réclamer l'appli- 
cation de matrices de règlement légèrement différentes, 


1 
telles que U4 = U3— 15 etUs= U3+ 5 (pourles joueurs 


A etB respectivement), qui assurent une équipartition des 
améliorations et gains. Leur jeu, cependant, n'en sera 
pas modifié. l 

L'entente entre A et B, cependant, peut encore amélio- 
rer les gains de chacun des joueurs, même si elle ne remet 
pas en cause le mode d'attribution des règlements. Pour 
le voir, portons en abscisse du diagramme (fg. 31) le 
gain de À, et en ordonnées le gain de B. Les couples de 
stratégies A1B1, A1B2, A2B1 et A2B2 déterminent les 
points P, O,R, S. Toute entente entre les joueurs ne peut 
que conduire à un point intérieur du quadrilatère PORS. 
Cependant, en l'absence d'entente, À est assuré d'obtenir 


; 1 _— à À . 
au moins x — 5 et y est assuré d'obtenir 3 Ils n'accepte- 


ront donc de s'entendre que pour un couple de stratégies 
mixtes coordonnées qui améliore leurs certitudes de gain, 
c'est-à-dire pour un point quelconque du triangle MNO. 
Ils préféreront, en outre, arrêter leur choix sur un point 
du segment MN, car seuls les points de ce segment ne 
leur permettent pas d'améliorer simultanément leurs gains 
par un déplacement dans OMN. Le segment MN 
constitue l'ensemble d'entente. La discussion entre 
A et B portera donc seulement sur la question de savoir 
lequel des points de ce segment sera retenu. Plus 
le point retenu sera proche de M, meilleur sera l'avan- 
tage retiré par B. Plus il sera proche de N, meilleur 
sera l'avantage retiré par À. Le choix final dépend donc 
de l'influence respective de A et B et de l'idée qu'ils se 
font d'un juste règlement. 


ANALYSE DES DONNÉES 


L'analyse des données regroupe les méthodes utilisées 
pour « décrire » de vastes ensembles de données. La 
complexité des phénomènes naturels se laissant rarement 
appréhender par l'observation d'une ou deux variables, 
l'intérêt d'une étude multidimensionnelle est d'éviter des 
choix a priori de caractères significatifs. 

Seul l'ordinateur peut traiter des tableaux de grande 
dimension, ce qui explique le développement récent de 
telles méthodes. Nous ne parlerons pas ici de la phase 
préliminaire à toute analyse statistique : celle de la collecte 
des données, qui, ainsi que l'interprétation des résultats 
obtenus, ne concerne pas seulement le statisticien. 

Il existe plusieurs techniques d'analyse multidimen- 
sionnelle, toutes ayant pour objectif de discerner les 
traits principaux des données recueillies. 


Analyse factorielle 


La plus ancienne de toutes les analyses factorielles, 
l'analyse en facteurs communs et spécifiques 
(Spearman), a été élaborée pour résoudre des problèmes 
du type suivant : à partir de relevés de notes obtenues par 
des enfants (les «individus ») à un certain nombre d'épreu- 
ves scolaires (les « variables » X1, X2..., X;, ...X»), il s'agit 
de trouver un petit nombre de nouvelles variables 
F1, F2... Fr, Fr, les facteurs communs et spécifiques, 
caractérisant le niveau scolaire d'un enfant. 

On suppose que chaque X; s'exprime comme combi- 
naison linéaire des facteurs F7; l'ensemble des notes 
mesurées par les X; peut ainsi être remplacé, de manière 
approximativement équivalente, par un ensemble de notes 
mesurées par les F1; les facteurs F1 « expliquent » donc la 
réussite — ou l'échec — scolaire d'un enfant. 

On voit que cette analyse exige des hypothèses restric- 
tives, contrairement aux autres analyses factorielles qui 
vont être exposées. 


Analyse factorielle en composantes principales 


Supposons qu'on dispose pour classer un ensemble 
d'individus de chacune de leurs mesures sur un ensemble 
de caractères quantitatifs appelés variables. On peut 
ranger ces observations dans un tableau X à n lignes et p 
colonnes si on suppose que les individus sont au nombre 
de n et les variables au nombre de p; x;; représente aans 
ce tableau la valeur de la /-ième variable x; pour le /-ième 
individu. 

Dans un langage géométrique, on peut représenter le 
tableau X de deux façons : soit » points dans RP, le 
i-ième point M; représentant le /-ième individu et ayant 
pour coordonnées sur le /-ième axe cartésien de R? 
(associé à X;) la valeur prise par cet individu pour la 
j-ième variable (dans le cas de trois variables, voir fig. 1); 
soit p points (caractères) dans l'espace R?. 

On choisit pour représenter les données l'espace qui 
a la dimension la plus petite et c'est en général celui des 
variables. Dans ce cas, on a alors un nuage de n « points 
individus » dans l'espace des variables R? qu'on munit de 
la métrique euclidienne, et lorsque p est supérieur à 3, 
on ne peut visualiser les données. 

Le principe de l'analyse en composante principale 
consiste à remplacer les p variables par un petit nombre de 
nouvelles variables F1, F2, … FX appelées facteurs, combi- 
naisons linéaires des précédentes, sans perdre trop d'in- 
formations, ce qui revient géométriquement à projeter 
le nuage des n points sur un sous-espace de dimension 
aussi faible que possible sans trop de distorsion. Il s'agit 
donc de choisir un nouveau système d’axes (qu'on pren- 
dra orthogonaux) qui s'adapte le mieux possible à la 
forme du nuage. 

Si on a, par exemple, trois individus et deux variables 
et si on suppose que les trois points M1, M2 et M3 ne 
sont pas alignés dans l’espace des variables, le problème est 


de rechercher une droite D telle que les projections M, M, 
LÉ g û 4 
et M, donnent le plus de renseignements possibles sur les 


positions relatives de M1, Mo et M3 (fig. 2). 

On peut imaginer beaucoup de critères mathématiques 
rendant compte de la « fidélité » de la nouvelle représen- 
tation. Citons-en quelques-uns : 


/ . 
— la somme des longueurs MiM, est minimale; 


axe de la variable X3 


u A axe de 
SL, la variable X: 


axe de la variable X; 


. / . . 
— le maximum des longueurs M;M, est minimal; 
# ” à 
— la somme des carrés des longueurs M;M; est 
minimale ; 
— si on accorde plus d'importance à certains indivi- 
dus plutôt qu'à d'autres, c'est-à-dire si on affecte à chaque 
individu un poids p;, on peut minimiser : 


/ 2 
D piMiM, ou D piMiM 
i i 
Le critère choisi dans l'analyse en composantes prin- 
cipales est le suivant : 
: + TNT 2 
maximiser : MM? 
ik 
; , 

où M, et M, sont les projections orthogonales de M: et 


MZ sur un sous-espace de R? de faible dimension. 
Appelons G le centre de gravité (ou point moyen) du 
nuage des points M; (G a pour j-ième coordonnée 


1 < : 
— > Xi |. On montre facilement que : 
ne 
i=1 / 

SN MM2— ‘M2 

DS MM2=2n GM. 

ik i 
On en conclut que le critère de l'analyse en composan- 


tes principales est équivalent au critère suivant : la somme 
des carrés des projections des GM; est maximale. 


Recherche des axes factoriels 
Appelons v;x la covariance entre les variables X; et Xz : 


1 < = : 
= À (Xi — Xj) (xir — Xx) 


et V la matrice des covariances des p variables : 
V est une matrice carrée de dimension p, symétrique 
(covar (X;, Xx) — covar (X4, X;)), 


positive (tw V w > O quel que soit le vecteur w de R?) 
et même définie, car si elle ne l’est pas, cela signifie qu'il 
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À En haut, figure T : 

un exemple de 

tableau X et sa 
représentation géométrique 
dans le cas de trois variables. 
Ci-dessus, figure 2 : 
recherche d'une droite D 
dans le cas de trois 
individus et de deux 
variables. 
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deuxième axe factoriel 


A Figure 3 : 

voir développement 

dans le texte 
Interprétation statistique. 


Y Ci-dessous, figure 4 : 
dans ce cas, 
l'individu (2) est 
très bien représenté, 
tandis que (1) et (3) 
le sont moins bien. 
En bas, figure 5 : 
dans cet exemple, 
la variable X;, 
qui est proche 
> > 
du plan (f1, f2), 
est bien représentée, 
tandis que la variable X;: 
l'est moins bien. 


premier axe factoriel 


existe une même relation linéaire entre les variables pour 
chaque observation et qu'on a une variable expliquée par 
les (p — 1) autres; on ne considère alors que (p—1) 
variables, ce qui entraîne qu'on n'envisagera que le 
cas où V est une matrice symétrique définie positive. 

Une telle matrice possède p valeurs propres réelles, 
strictement positives. Classons les vecteurs propres uni- 


taires FA dans l'ordre décroissant des valeurs propres (si 
on a des valeurs propres multiples, le classement n'est 
pas unique ; ce problème ne sera pas envisagé ici). 

On démontre que : /e sous-espace à m dimensions 
(m < p) sur lequel le nuage se projette avec une défor- 
mation minimale est engendré par les m premiers vecteurs 
propres. 

On appelle /-jème axe factoriel l'axe défini par le /-ième 
vecteur propre, et le /-ième vecteur propre est appelé 
l-ième composante principale. 


Interprétation statistique 
Quel que soit le point M:, il est possible de le repérer 


> > > > 
dans la base #1, f2, …, ñ, …, f,. Appelons c: la /-ième coor- 
donnée de M; dans cette nouvelle base (fig. 3). 

Au /-ième axe factoriel, on peut donc associer une 
variable F; qu'on appelle /-jème facteur et qui a pour 
composantes : C1, Car, …, Cil, …, Cnl. 

On peut considérer les facteurs comme de nouvelles 
Variables et l’ordre dans lequel sont rangés les cx sur le 
I-ième axe factoriel peut permettre d'interpréter le 


axe de la variable X4 


axe de la variable X; 


premier axe factoriel 


fig. 5 
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1-ième facteur. Mais il faut être très prudent et s'assurer 
avant d'interpréter que les proximités constatées sur l'axe 
factoriel correspondent réellement à une proximité dans 
l'espace et non seulement à un « effet d'optique » dû à la 
projection. On montre que : 


cos (GM:, ñ) me 
IG] 


et si, par exemple, pour un point M;,ona: 
+ + + > 
cos? (GM:, 1) + cos? (GM:, f2) Æ 1 
on pourra en conclure que M; est très proche du plan 
des deux premiers axes factoriels. Sur la figure 4, l'indi- 
vidu (2) est parfaitement représenté, tandis que (1) et 
surtout (3) le sont moins bien. 

On démontre que la moyenne d'un facteur est égale à 
la composante de la projection du point moyen G sur 
l'axe factoriel qui lui correspond et que sa variance est 
égale à la valeur propre associée. On a ainsi sur le premier 
axe factoriel la plus grande dispersion des projections des 
«points individus ». On peut donc dire que les axes facto- 
riels ont la propriété d'extraire progressivement le plus 
d'informations possibles sur l'ensemble du nuage. Le coef- 
ficient choisi pour mesurer la fidélité de la projection 
du nuage sur les m premiers axes factoriels est : 


trace de V 


coefficient égal à 1 pour m = p (déformation nulle). 

On peut représenter les variables sur un axe factoriel 
ou un plan factoriel en projetant sur cet axe ou ce plan 
leurs axes et vecteurs unitaires (fg. 5). 

Soit e; la projection du vecteur unitaire de la /-ième varia- 


ble. On montre facilement que sa composante sur le 
1-ième axe factoriel est f;. Si la longueur de e; est voisine 


de 1 dans le plan des deux premiers axes factoriels, 
cela signifie que l'axe de la variable X; est proche du plan 
de ces deux premiers axes. Il est donc intéressant de 


considérer les positions des extrémités des vecteurs €; 


par rapport au cercle de centre O et de rayon 1. Sur la 
figure 5, la variable X; est bien représentée : elle est 


> > 
proche du plan (f1,f2), tandis que la variable Xx l'est 
moins bien. 

On démontre que le coefficient de corrélation entre 
la variable X; et le facteur F; est égal à : 

? (X F:) = Ju fi 
\vÿ 

Si toutes les variables ont des dispersions voisines, on 
pourra donc dire que le /-ième facteur est le plus corrélé 
avec les variables pour lesquelles les f; sont les plus grands 
en valeur absolue (corrélation directe si les ñ; sont positifs 
et inverse s'ils sont négatifs). 

Si on a des points M: voisins de l'axe de la variable X; 


dans le plan des deux premiers axes factoriels, cela peut 
vouloir signifier que M; est proche de l'axe de la /-ième 
variable dans R? si le nuage n'est pas trop déformé. 
Ceci implique alors que la variable X; caractérise le /-ième 
individu, mais il vaut mieux prendre la précaution de 
vérifier que cette proximité a toujours lieu dans le plan 
des 3° et 4° axes factoriels, car un point M; peut être situé 
en projection sur l'axe de la variable X;, tout en étant fort 
éloigné de cet axe dans l’espace RZ. 

Un axe factoriel peut donc être interprété à l'aide des 
variables ou par l'intermédiaire de l'échantillon d'individus 
envisagé, cette dernière interprétation ayant l'avantage 
d'être moins tautologique que celle qui s'appuie sur les 
variables elles-mêmes; cependant il faut avoir conscience 
que le lien établi entre deux familles de variables à l'aide 
d'un échantillon d'individus risque de n'être qu'accidentel 
et il est nécessaire d'être prudent avant de tirer une conclu- 
sion. 

Lorsque les données sont hétérogènes, l'analyse en 
composantes principales est plus intéressante si elle est 
faite sur des variables centrées réduites, ceci afin d'éli- 
miner les effets de taille. 


Analyse factorielle des correspondances 

Nous allons la présenter à partir d'un exemple. Sup- 
posons que l'on s'intéresse aux résultats d'élections dans 
les diverses circonscriptions de Paris; on dresse alors 
un tableau K = (k;;) où l'on trouve à l'intersection de la 
ligne / et de la colonne / le nombre de suffrages obtenus 
par le candidat / dans la circonscription j. 

L'analyse des correspondances permet de comparer 
les circonscriptions (deux circonscriptions se ressem- 
bleront d'autant plus que les pourcentages de chaque 
candidat par rapport au nombre de suffrages comptabi- 
lisés dans chacune d'elles seront plus proches) ou les 
candidats (deux candidats sont d'autant plus proches 
que les pourcentages des suffrages obtenus dans chaque 
circonscription par rapport au nombre total des suffrages 
obtenus par chacun d'eux sont plus voisins). 

Deux remarques s'imposent ici : 

— l'ensemble | des » circonscriptions et l'ensemble J 
des p candidats jouent des rôles tout à fait symétriques; 

— la comparaison des lignes ou des colonnes se fait 
non sur les données brutes mais sur les profils ae ces lignes 
ou de ces colonnes. 


k:: 
Si l'on pose : & — 3 kg, fÿ = F1 fi = p1 Fÿ 
ii ÿ 


le profil de la circonscription / est le vecteur 


; 1 
fi “: fis avec fi = (fi, fo, … 


… lip) 
On considère le nuage des n circonscriptions : 
NV (D = {hi n} 
où fi est le vecteur déjà cité et #; un coefficient de 
pondération et symétriquement le nuage : 
NO =) 1i= 1. p} 


fj = À fe 
i 


5 1 
SE ET. — 
où fe = L E (fiÿs For cu fn) 
La distance du y? définie par 


Le 1ff5 hi)? 
RENTE) = 


Î 


î 
fr — 


7. 1 (fa fa? 6 _ we 
2 _ Pt = Æ 
d? (j.1°) >; (& ca IL fr 


i 


traduit la proximité que nous avons décrite dans la pré- 
sentation et surtout qui respecte le principe d’équiva- 
lence distributionnelle, à savoir : si deux vecteurs 
colonnes (ou lignes) ont même profil et si on leur 
substitue dans le tableau une colonne (ou une ligne) 
unique égale à leur somme, alors la distance distribution- 
nelle entre éléments de | (de J) n'est pas modifiée. 

Cette propriété est fondamentale car elle rend la 
méthode peu sensible aux partitions adoptées dans les 
ensembles | et J. Dans l'exemple que nous avons choisi, 
le découpage des ensembles | et J s’imposait mais ce 
n'est pas toujours le cas. Ainsi, imaginons une enquête 
sur la consommation alimentaire des ménages; faut-il 
mettre sous des rubriques différentes les dépenses 
concernant les boissons gazeuses et les jus de fruits ? 
C'est inutile, si ces dépenses ont des profils voisins 
(c'est-à-dire représentent des comportements similaires) ; 
cela peut être intéressant sinon, mais la question ne se 
pose plus si l'on a choisi comme distance celle du y2. 
La stabilité des résultats obtenus en analyse des corres- 
pondances provient de ce qu'ils sont relativement 
indépendants de l'arbitraire des nomenclatures. 

Si on modifie l'échelle des axes, plus précisément si 
on représente la /-ième ligne par le vecteur 

OM; = . fa sr fo = (x, ess Xip) 
hi NA fi fe fi fo 
alors d2 (1,5) = Ÿ (x — x; 
Î 
comme dans l'analyse en composantes principales. 
L'analyse des correspondances revient à effectuer une 


analyse en composantes principales sur des points dont les 
coordonnées ont été modifiées de telle sorte que la dis- 


tance entre ces points, calculée sur le tableau initial, soit 
une distance du 2. 

Analyser la correspondance entre | et J, c'est mesurer 
à quel point le phénomène étudié diffère de l'indépendance 
statistique entre | et J. 

S'il y avait indépendance statistique, c'est-à-dire si 
pour tout / de l'ensemble | et tout / de l'ensemble J 
fi = hf, alors : 


fifi fife ffp ) OI \ 
OM: = : Le, ER ) = [VA V?e, …, \ = OG 
NA fe ff 
tous les points du nuage seraient confondus avec le centre 
de gravité G — 1 fMi. 
i 


Ceci est généralement faux, et étudier la dépendance 
entre | et J revient à déterminer la « forme » du nuage 
N° (1) ou N° (J) : recherche des directions d’allongement, 
axes principaux d'inertie, etc. 

C'est encore, dans le cas où le tableau analysé est un 
tableau de contingence, mesurer en quoi la quantité : 


F5 — ff; 
d= Sk (W il 


réalisation d'un X2(» — 1) (n —1), diffère significativement de 
zéro. 
On démontre que l'inertie totale du nuage N° (1), de 
2 


2 2 .d : 
même que celle du nuage N° (J), est égale à + la matrice 


d'inertie H étant R'R où R est une matrice de terme général 
F5 — fit; 

7 
la matrice d'inertie du nuage N° (J) esttR R =S. 


Les valeurs propres non nulles de H et S sont les mêmes; 
de plus, si u est un vecteur propre de H, on a 


Hu = RtRu = ju 
d'où, en multipliant par fR : 
GR R) Ru = À éRu 


‘Ru est vecteur propre de S. 

Il en résulte une relation linéaire particulièrement simple 
entre les facteurs des deux analyses. 

La symétrie des opérations effectuées dans l’un ou 
l'autre nuage a pour conséquence que l'analyse en compo- 
santes principales peut se faire indifféremment dans 
l'espace des individus ou dans celui des variables. Prati- 
quement, cela permet de choisir l'espace de dimension 
la plus faible. 

On peut signaler rapidement quelques résultats complé- 
mentaires : le nuage N° (I) appartient à l'hyperplan 
orthogonal à OG. OG est vecteur propre de H, associé 
à la valeur propre 0; la recherche des vecteurs propres 
et valeurs propres de H se ramène à celle des vecteurs 
propres et valeurs propres de W où: 

Wa = RCI 
DANCE 
OG étant le vecteur propre de W associé à la valeur pro- 
pre 1. Toutes les autres valeurs propres de W sont compri- 
ses entre Det 1. 

La représentation simultanée des deux nuages sur les 
plans factoriels, la possibilité de projeter sur ces plans 
des individus (ou des variables) supplémentaires amélio- 
rent la puissance de la méthode. 

L'interprétation des facteurs se fait à partir des gra- 
phiques (plans des axes 1 — 2,1 — 3, 2— 3, etc.) à l'aide 
des listes de contributions qui mesurent l'importance de 
chaque élément dans l'apparition d’un facteur, ou rendent 
compte de la contribution du facteur à tel ou tel élément. 

L'exemple choisi (comparaison des résultats d'élec- 
tion dans différentes circonscriptions) est celui d’un 
tableau de contingence, mais l'analyse des correspon- 
dances a de multiples applications : tableaux de mesure, 
tableaux de note d'intensité, tableaux de description 
logique (tableaux remplis de 1 et de O suivant la présence 
ou l'absence d'un certain caractère pour un individu 
donné). On démontre dans ce dernier cas que si le tableau 
logique est mis sous forme disjonctive complète, son 
analyse est équivalente à celle du tableau de contingence 
associé. 
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À Figures 6 et 7: 

deux illustrations tirées 
de l'ouvrage 

de J.-P. Benzecri et coll. : 
l'Analyse 

des correspondances, 
tome II de l'Analyse 
des données Dunod) 
et portant sur l'analyse 
de 30 marques 

de cigarettes. 


» Figure 8: 


- 
la direction u sépare les 
trois groupes. 


Gïitanes 


O 
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L'analyse des correspondances issue de l'étude de 
tableaux de contingence suppose que le tableau initial 
soit un tableau de nombres positifs. Si tel n'est pas le cas, 
on peut procéder par dédoublement des colonnes. 

L'analyse des correspondances est due au professeur 
J.-P. Benzecri (voir Bibliographie). 

Exemple d'application : analyse de 30 marques de 
cigarettes (fg. 6 et 7). Chaque marque a été testée auprès 
de 100 fumeurs interrogés sur ses caractéristiques de 
qualité, d'agrément et de coût. La cohérence des réponses 
a été vérifiée par une comparaison avec 3 lots de paquets 
de cigarettes de qualité différente. 

L'analyse des correspondances donne de très bons 
résultats : en effet les deux premiers axes totalisent 
82 % de l'inertie du nuage. 

Sur le schéma on remarque que le premier axe classe 
dans l'ordre croissant les différentes modalités de la 
qualité, de l'agrément et du prix, et que le deuxième axe 
oppose les valeurs extrêmes (peu cher, très cher, ordi- 
naire, luxe) aux valeurs moyennes. 


Analyse discriminante 


On suppose que sur une population répartie a priori 
en g classes disjointes, on a mesuré p variables. L'objectif 
de l'analyse discriminante est de rechercher sur les varia- 
bles une formule, linéaire ou autre, qui permette de déter- 
miner la classe à laquelle doit être affecté chaque individu. 

Par exemple, le dossier médical d’un sujet / (n sujets) 
contient les résultats numériques de p examens 
… Xip) 
et un diagnostic y: (q modalités). Une analyse discrimi- 
nante indiquera les examens qui permettent le mieux de 
différencier les diagnostics et donc éventuellement de 
déceler ceux qui sont le moins utiles; d'autre part la for- 
mule établie sur les variables les plus discriminantes don- 
nera le diagnostic de tout nouveau malade. 

Les n individus peuvent être représentés dans [R?, 
muni de la métrique usuelle (fig. 8). À chaque point x 


(xx, Xi2, .… 
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PEU CHER 


1 , 
on affectera la masse mi = FT Le problème revient à cher- 


cher dans RP la direction qui sépare au mieux les g groupes. 
Si on désigne par | l'ensemble des individus, pour u fixé, 


Vi (u) = > mi u(x}? est la variance totale, 
iel 
Var (u) = > miu(x: — gr)? est la variance intra- 
Xi € 8r 
classe de la classe gr, 
Ve (u)= Ÿ myu (gr —3) est la variance inter- 
greg 
classes, 
| ? 
avec u (ft) = F: uit; 
= 1 
gr centre de gravité de la classe g- 
Mgr = 2 m: masse de la classe gr 
Xi e8r 


g centre de gravité de G — {g1, 92, … ga} 


Le critère choisi consiste à rendre la variance inter- 
classes la plus grande possible (centres de gravité des 


groupe 3 


groupe 2 


s + 
groupe 1 
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classes espacés) et les variances inter-classes les plus 
faibles possibles (classes peu dispersées). Plus précisé- 
ment on cherchera à maximiser le rapport 


Vg (u) 


D Ve (u) 
8re $ 
Or on sait d’après le théorème de Huyghens que : 


Vi (u) = Ve (u)+ D Va (u) 


8re% 
Ve (u) 


Le problème posé équivaut à maximiser , u étant 
Vi (u) 


un vecteur unitaire. 

Si on désigne par T la matrice des veriances totales et 
par B la matrice des variances inter-classes, la solution 
du problème sera telle que T-1Bu = À u, x étant la plus 
grande valeur propre associée à la matrice T- 1B. 

On estramené au problème suivant: effectuerune analyse 
en composantes principales sur le nuage GS des centres 
de gravité de forme quadratique d'inertie B, l'espace vec- 
toriel des individus | étant muni de la métrique T- 1. 

Dans la pratique, » (nombre des individus étudiés) 
doit surpasser p (nombre de paramètres de dispersion), 
sinon on ne connaît pas la dispersion des classes autour 
de leur centre et on ne peut savoir à quelle classe rattacher 
un nouvel individu. Diverses méthodes de calcul ont été 
proposées (Fischer, Mahalanobis). 


Régression linéaire 


La régression linéaire répond à un problème moins 
descriptif que l'analyse factorielle : on a n observations 
sur p + 1 variables (en général n est nettement plus grand 
que p), et il s'agit d'examiner comment on peut expliquer 
une de ces variables [la (p + 1)-ième par exemple] 
à l’aide d'une combinaison linéaire des p autres. 

La représentation géométrique la plus simple consiste 
à se placer dans l'espace euclidien orthonormé R7 en 
considérant chacune des variables x comme un point de R7 
dont les composantes dans la base de R7 sont les valeurs 
que cette variable a prises respectivement pour les 7 obser- 
vations. Pour la commodité des développements ulté- 
rieurs on supposera que toutes les variables sont centrées. 
Mentionnons que l'opération de centrage s'interprète 
géométriquement comme la projection orthogonale des 
variables non centrées sur l'hyperplan orthogonal à la 
« bissectrice » des axes (droite de vecteur directeur 


1.1 
Fe re = dans la base choisie). 
\n° n° "\n 

Ces variables x1, X2, …, Xp engendrent un sous-espace 
vectoriel W de R* dans lequel il s'agit de trouver le point 


ÿ « le plus proche possible » du point y représentant la 
(p + 1)-ième variable (fig. S). 
L'intention explicative, voire prédictive, d'un tel modèle 


est claire : connaître la valeur y: que ÿ a prise à la /-ième 
observation permet d'approcher la valeur y; de y pour 
cette même observation. Mais la précision de cette approxi- 


mation dépend évidemment de la distance de y à ÿet dei. 
La variable y peut aussi se prêter plus ou moins bien à une 
régression linéaire en l'ensemble des variables x;. Inver- 
sement, le fait de trouver une bonne régression ne doit 
pas entraîner imprudemment à des conclusions sur les 
variables considérées. 


On suppose que y1, V2, … n Sont les réalisations 


8 Wir cor 


d'un échantillon de taille » d'une variable aléatoire Y, 
de même que xj1, Xjo, …, Xji, … 


,; Xjn Celles d'une variable 
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aléatoire X;. Le modèle linéaire suppose qu'entre les 
p variables explicatives X1, …, X;, …, X, et la variable expli- 
quée Y existe la relation suivante : 


ss Ni No) = p: 


E (Y/X1, X2, 


donc que : 


Cela revient à supposer que Ÿ ne diffère d’une combi- 
naison linéaire des X; que par un résidu aléatoire d'espé- 
rance nulle. 

Puisqu'on dispose d'un échantillon de taille » de cha- 
cune des variables Y, X1, …, X;, …, X», on a les relations 


suivantes : 
Va = Pix + Box + Bixyz BpXpi + e1 
Vi = Gixui + Box; Xi BpXpi + € 
Ÿn = BiXin + Boxer BiXin BpXpn + En 


Ce système d'équation peut s'écrire sous forme matri- 
cielle : 


> > > 
= XB—e 
Qi re 
où : pe (Vis Vas Vis Yn), 
#3 — (B1, Bo, …, By, … Bo), 
se 
te — (e, e2, …, eï, …, en), 
X11 + Xj1  Xp1\ 
et X — Ce: ses. nes 7 
\Xin  Xjn -… Xpn 


Pour estimer £, on est obligé de faire des hypothèses sur 
les résidus et les variables explicatives. Si on peut sans 
trop de risque faire des hypothèses assez fortes sur les 
résidus, on emploie la méthode des « moindres carrés 


ordinaires » (M.C.O.) qui donne pour estimation de ô 
D = (XX)-11Xÿ 
Cette méthode revient à calculer à qui minimise : 
> tb & > > > > 
hy— XD =? (y— Xb) (y — Xb) 
qui n'est autre que le carré de la distance euclidienne de y 
à la variété linéaire engendrée par les p vecteurs colonnes 


de X. 
Sous ces mêmes hypothèses, on démontre que l'estima- 
> 


teur associé à l'estimation b est un « bon estimateur », 
c'est-à-dire qu'il est sans biais et convergent. 

Lorsque les hypothèses sur les résidus ne sont mani- 
festement pas remplies, on emploie une méthode qui en 
demande de moins fortes, mais qui est plus compliquée : 
«la méthode des moindres carrés généralisée » (M.C.G.). 

Remarque : dans certains problèmes de régression, 
il peut être nécessaire d'imposer des contraintes : par 
exemple, siles coefficients B; représentent des prix, ils doi- 
vent être positifs ou nuls, s'ils représentent des probabilités, 
ils doivent être compris entre O et 1 ; on est alors dans le 
domaine de la programmation quadratique. 

Il est naturel de dire que la régression est d'autant 
« meilleure » que | e| = | y — ÿ || est plus faible. 

On mesure la qualité de la régression par le rapport : 


ona0<R< 1etla régression est évidemment d'autant 
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4 À gauche, figure 9 : 

les variables Xx:, X2, .…., X> 
engendrent un sous-espace 
vectoriel W de R° 

dans lequel il s'agit 

de trouver le point ÿ 

« le plus proche possible » 
du point y représentant 

la (p + 1)-ième variable. 

A droite, figure 10 : 

R = 4 est donc analogue 


à un coefficient 

de corrélation puisque si 
R* est muni de la métrique 
euclidienne, R = cos «. 
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À A gauche, figure 11 : 
a, tous les y 
sont approximés 
avec la même précision, 
qui est bonne; 
b, l'approximation 
est d'autant plus mauvaise 
que y; est grand 
— il faut donc modifier 
le modèle. 

A droite, figure 12 : 
représentation géométrique 
dans l'espace R”" 

des individus. 


meilleure que R est voisin de 1. Puisque R? est muni de la 
métrique euclidienne, R n'est autre que le cosinus de 
die : 


l'angle yOY. R est donc analogue à un coefficient de 
corrélation (fig. 10). 
Si les variables ont été préalablement centrées : 


se IE _ covar (y. ÿ) 
IÏL IFUPT  o° 
Æ — 
car 1] = à y? = \n oy: 
i=i 
y = ÿ? = \n 0j: 


> > > 


et y — ÿ étant orthogonal à ÿ,ona: 


P, ce qui entraîne que : 


PIE 


IYP 


ñ 
FE = ncovar (y, Ÿ). 


On déduit de ces résultats que R n'est autre que le coeffi- 
cient de corrélation entre y et ÿ. On l'appelle coefficient 
de corrélation multiple entre la variable y et l'ensemble 
{ka X2, …, Xj, …, Xp} des Variables explicatives. 

On utilise aussi un autre rapport pour mesurer la qualité 
de la régression : 


| y —Ÿ|?/n-p 182 P— ÿe 

Considéré comme une statistique d'échantillon, ce rapport 
suit, moyennant certaines hypothèses, une distribution de 
Fischer-Snédecor à p et (n — p) degrés de liberté et, par 
référence à une table donnant la distribution de F, on peut 
juger de la « signification » de la régression. Ce rapport 
permet aussi de juger de l'intérêt d'inclure certaines 
variables dans la régression en mesurant « le pouvoir 
explicatif » de (p — q) variables restantes alors que les 
g premières ont été utilisées. 

Les rapports R et F ne donnent pas un examen détaillé 
de la qualité de la régression. Pour se rendre compte de 
l’approximation faite quand on remplace y; par ÿ, il faut 
examiner la variation des quantités €; = yi —}; en fonc- 
tion de /. Pour cela, la méthode est de représenter dans un 
plan les couples (y, &:), ce qui permet de se rendre compte 
si le résidu e; est influencé par la valeur de y; (fig. 11). 

Il y a d'autres méthodes statistiques qui s'apparentent 
à la régression linéaire : la régression polynômiale qui 
se résout avec les mêmes techniques que la régression 
linéaire et l'analyse de la variance qui utilise des modèles 
de régression avec des variables explicatives qualitatives. 

Il existe aussi des méthodes de régression multiple 
utilisées lorsqu'on a plusieurs variables à expliquer à 
l'aide des mêmes variables explicatives. 


Analyse canonique 


On peut considérer que l'analyse canonique généralise 
la régression linéaire, en ce sens qu'elle consiste à confron- 
ter deux groupes de variables quantitatives qui ont été 
mesurées sur ? individus : 


212 


— p Variables X1, X2, …, XY appartenant à un certain 
domaine (par exemple économique), 

— gq Variables Y1, Y2, …, Y, appartenant à 
domaine (par exemple sociologique) ; 
et à trouver jusqu'à quel point on peut prévoir l’un des 
deux groupes à partir de l'autre. 

On place les données dans un tableau R à n lignes et 

(p + gq) colonnes après avoir centré les variables : 


un autre 


X11 Xo1  Xp1 | Vi Voi … Vai 
1 
1 
R= Xi Xi … Xni ! ai Vai … Vi 
H 1 
= ! 
X1n X9n .… Xpn | Vin V2n …… Yan 


On adopte la représentation géométrique dans l'espace 
R? des individus comme pour la régression linéaire 
(fig. 12). 

En généralisant l'idée développée dans le modèle de 


z . . ’ « ie 
la régression, il s’agit de trouver un vecteur U: du sous- 


Ê LA 
espace Wi engendré par les variables x et un vecteur Uz 
du sous-espace W2 engendré par les variables y de telle 


ES nd 
sorte que UÜ: et Uz fassent entre eux l'angle le plus petit 
possible. 

Statistiquement, cela revient à chercher deux variables, 
chacune étant une combinaison linéaire d'un des deux 
groupes de variables considérées, qui soient le plus 
correlées possible. Ceci peut permettre, mais avec pré- 
caution, de prévoir comment se comporte, par exemple, 
un individu sur U si on connaît son comportement selon 
« l'aspect » Ui. 

Notons déjà que si Wi et W2 sont identiques, alors toute 
combinaison linéaire des x est combinaison linéaire des y 
et réciproquement. Par contre, si W1  W: = g, toute 
combinaison linéaire des y est orthogonale à toute combi- 
naison linéaire des x et on dit alors que les variables y et x 
sont totalement différentes. 

On vient de considérer deux situations extrêmes entre 
lesquelles il existe une infinité de situations intermédiaires 
possibles. 

On démontre que la solution du problème posé s'obtient 
par le calcul des valeurs propres et vecteurs propres des 


_ _ a | — 

matrices V2 Vzy a Vuyz et Vyy Vyx ne Vzy OÙ Vrx et Vyy 
désignent respectivement les matrices des covariances des 
variables x et des variables y, et V., désigne une matrice 
à P lignes et q colonnes dont le terme général de la 
i-ième ligne et /-ième colonne est égal à covar (xi, }5) 
[Vyz se définit d'une façon semblable]. Ces deux matrices 
ne sont pas du même ordre si p  q, mais sont de même 
rang. Elles correspondent aux opérateurs produit des 
projecteurs de W. sur W2 et de W: sur Wi. 

On démontre que ces deux matrices ont des valeurs 
propres égales toutes positives ou nulles et que le nombre 
de leurs valeurs propres égales à 1 est égal à la dimension 
de Wi N We. 

On démontre aussi que le premier couple (Le, Le. 
solution du problème, correspond respectivement aux 
vecteurs propres unitaires de 


VE M Vo Vi RS Vale 

associés à la plus grande valeur propre différente de 1. 
On l'appelle premier couple de variables canoniques, et la 
valeur propre correspondante est égale au carré du coeffi- 
cient de corrélation linéaire entre ces deux variables. 

On peut évidemment, comme en analyse factorielle, 
poursuivre l'étude en cherchant les couples suivants de 
variables associées (U1@2, U2@), (U1®), U2@), … On 
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démontre que U1% et U1® associés à des valeurs pro- 
pres distinctes sont non correlés, de même que U1%) et 
U2®), 

Pour interpréter les variables canoniques et par exemple 
U: on peut calculer les corrélations de chacune des 
variables x avec U: pour essayer de savoir dans quelle 
mesure chacune d'elles participe à sa constitution. 

On peut projeter les variables x et y dans des plans 
engendrés par les variables canoniques de Wi et dans des 
plans engendrés par celles de W», ce qui permet de visua- 
liser les résultats d'une manière un peu semblable à ce qui 
a été fait pour l'analyse factorielle. 

L'analyse canonique est ainsi une généralisation de 
la régression et concerne des ensembles de variables quan- 
titatives qu'on a quelque raison de partitionner en deux 
sous-ensembles. On montre que l'analyse des correspon- 
dances et l'analyse discriminante peuvent être considérées 
comme des cas particuliers de l'analyse canonique. 


Classifications automatiques 


Ce sont les naturalistes qui, à la suite de Linné (1707- 
1778), ont établi avec l'inventaire systématique du règne 
animal et du règne végétal la plus célèbre des classifi- 
cations. Leurs groupements en règnes, embranchements, 
ordres, familles, tribus, genres, espèces fournissent un 
exemple particulièrement riche de classification hiérar- 
chique. L'avènement des ordinateurs, l'élaboration de cri- 
tères de classification et la mise au point d'algorithmes 
ont permis d'étendre ces méthodes à des domaines variés, 
en sciences exactes et en sciences humaines. 

Toute classification a pour but de déterminer des regrou- 
pements sur un ensemble de données afin d'en obtenir 
une perception simplifiée mais globale. En termes mathé- 
matiques, cela revient à construire une partition de l'en- 
semble considéré. On distinguera la notion de classifi- 
cation de celle de classement qui consiste à placer un 
élément quelconque dans une classe déjà déterminée. 
Les problèmes abordés peuvent être de nature extrême- 
ment diverse : ainsi on peut chercher à regrouper des 
régions suivant leurs activités économiques, élaborer 
une nomenclature de ces activités, analyser des réponses 
à un questionnaire, étudier la répartition de la faune ou de 
la flore d'une certaine région, etc. 

Il existe plusieurs méthodes de résolution du problème 
de classification. On peut procéder : 

— parregroupements successifs des constituants : on 
suppose au stade initial que tous les individus appar- 
tiennent à des classes différentes; à chaque pas, on 
regroupe certains d’entre eux dans une même classe; 
les partitions deviennent de moins en moins fines (c/assi- 
fication ascendante) ; 

— par fractionnements successifs des classes : au 
stade initial, tous les individus sont dans une même classe 
que l'on sépare en deux ou plusieurs sous-ensembles 
disjoints, puis on réitère le procédé (classification des- 
cendante). 


Classification hiérarchique ascendante 

La première étape consiste à définir une mesure 
de proximité sur l'ensemble des individus à classer. On 
appelle mesure de proximité la donnée d'un tableau symé- 
trique n x n où la case (/,j) indique la ressemblance 
des individus / et j. Le choix de cette mesure est un des 
points les plus délicats et nécessite une bonne connais- 
sance du domaine étudié. Parmi les mesures de proximité, 
on peut citer : 

© l'indice de similarité s 

s est une application E x E — R* telle que 


s (x. y)=s(y,x) VxyeE 
s(xx)=s(py)>s(x7y) VxyeE 

Lorsque pour chaque individu on relève la présence ou 
l'absence de p caractères (variables), on peut poser : 
s — nombre de caractères possédés à la fois par /etj 
t — nombre de caractères non possédés à la fois par / 

et j 

u = nombre de caractères possédés par / et non par 
v = nombre de caractères possédés par / et non par/ 
Les indices suivants ont été utilisés par les taxinomistes : 


Indice de Sokel et Nichener (1958) : °°? 


4 » ri 
‘ 
< AE LE 


ISERE 


Ciccione - Rapho 


indice de Rogers et Tanimoto (1960): = 


s+t 
u+v 


indice de Sokal et Sneath : 


e l'indice de dissimilarité 
d:E x E — R+ vérifiant 
(a) d'(xy) = d(y.x) VxyeE 
(b) d'(x, x) = 0 


e l'indice de distance 


d vérifie (a), (b) et (c) 


(c) d(xy)=0—= x=7y VxyeE 


e /a distance 
d vérifie (a), (b), (c) et (d) 
(d) dix y) < d(xy)+d(y.2) Vxy,z€E 


e /a distance ultramétrique 
d vérifie (a), (b), (c) et (e) 
(e) d'(x.y) < Max (d (x,z), d'(z,y)) Vx,y,z2€E 


On démontre que (d) = (e) et que si d'est une dis- 
tance ultramétrique, alors tout triangle est isocèle, et lors- 
que deux boules ont un point commun, l’une est incluse 
dans l’autre. L'indice de similarité est transformé en indice 
de dissimilarité par d (x, y) = s (x, x) — s (x, y). 

A toute partition d’un ensemble on peut associer une 
distance ultramétrique en posant : 


VieE d(i,i) = 0, d (i,j) = 1 pour tous les couples f, 
j appartenant à deux classes distinctes. 

d'(i,j) = 1 (0 < / < 1) si / et / appartiennent à la même 
classe. 

Ainsi la mesure de proximité peut être une distance et 
même une distance ultramétrique, mais ce choix n'est 
pas toujours possible ; cela dépend essentiellement de la 
nature des données. 
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y Figure 13: 

l'ordre des individus a,b,..….e 
sur l'axe est 

sans importance; 

il est choisi de facon 

à éviter le chevauchement 
des branches. 


» Figure 14: 
visualisation, sous forme 
de hiérarchie de parties 
de E, de la procédure. 


» Figure 15 : 

cinq classifications 
compatibles avec l'arbre 
de le figure 13. 


Dans la deuxième étape, on est amené à agglomérer 
des classes: il faudra donc définir une proximité entre 
parties de E (parties éventuellement réduites à un élé- 
ment). Si À et B désignent deux parties non vides de E 
et d, l'indice de proximité sur E, on peut poser : 


max (A, B) = Max{d (x y)|x€e A, yeB} 
Smin (A, B) = Min{d (x, y)|xEeA,yEeB} 
Ômax min (A, B) = 
Max { Max Min d (x, y), Max Min à (x, y) | 
lxeAyeB yeBxeA 


si E est un espace métrique 
3g (A, B) = d (G4, Gs) 


GA, Ge désignant les centres de gravité de A et B. 

Les 5 sont des indices de proximité mais en général 
pas des distances. 

Là encore il faut choisir l'indice qui s'adapte le mieux 
au phénomène étudié. Lorsque le choix ne s'impose pas, 
il est prudent de se préoccuper de la stabilité des résultats 
obtenus. 

Les étapes suivantes consistent à regrouper pas à 
pas les classes les plus proches. Au bout de (7 — 1) pas 
au plus, la procédure s'arrête. 

La figure 13 montre comment on peut visualiser la 
procédure. 
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Ici quatre pas ont été nécessaires. L'arbre ainsi 
construit permet de découvrir les partitions successives 
apparues à chaque pas. La partition initiale en classes à 
un élément {a}, {b}, {c}, {d}, {e} devient à l'issue du pre- 
mier pas {a, b}, {c}, {d}, {e} puis {a, b, d}, {c}, {e} et 
enfin {a, b, d}, {c,e} avant le regroupement final. Les 
partitions réalisées sont de moins en moins fines (on 
dit qu'une partition P est plus fine qu'une partition P’, 
si tout élément de P est élément de P’). 


Hiérarchie stratifiée et ordonnance 
La procédure aurait pu aussi bien être représentée 
(fig. 14) sous forme de hiérarchie de parties de E. 


H est une hiérarchie de parties de E si: 
— Hestunsous-ensemble de parties deE (HT (E)) 
— {JEH VxeE 
— E€H 
— ANBE{A,B,g} VAEH, VBEH 


ce qui traduit que deux éléments de H sont disjoints 
ou sinon l’un est inclus dans l'autre. 

La donnée d’une hiérarchie H ne permet pas de savoir 
dans quel ordre se sont effectués les regroupements. Par 
exemple, c et e peuvent avoir été réunis avant a, b et d. 
Pour préciser que l'ordre des groupements est connu, 
on dit que l'on a une hiérarchie stratifiée, alors dans l'arbre 
de classification on connaît l’ordre de formation des 
nœuds, ce que l'on visualise en les traçant d'autant plus 
haut qu'ils correspondent à des regroupements plus 
tardifs. Les partitions compatibles avec une hiérarchie 
stratifiée sont celles que l’on obtient en coupant par des 
horizontales l'arbre de classification associé. 

La figure 15 montre cinq classifications compatibles 
avec l'arbre de la figure 13. 

L'examen de cet arbre permet de dire en outre si telle 
paire d'éléments de E a été réunie ou non avant telle 
autre. Une hiérarchie stratifiée sur E induit un ordre sur les 
paires d'éléments de E, un tel ordre est appelé ordonnance 
sur E. 


Pour l'exemple choisi on aura : 


{a, a} = {b, b} = {c, c} = {d, d}= {e, e} < {a, b} < {a, d} = 
{b, d} < {c,e} < {a,c} = {a,e} = {b,c}={b,e} = {d, c} = 
{d,e} 
(ARE © 


Hiérarchie indicée et ultramétrique 

On améliore encore les résultats précédents en adop- 
tant une mesure sur l’axe vertical de l'arbre : à chaque 
nœud sera associé un indice d'autant plus grand que le 
nœud sera plus élevé sur l’axe vertical, on dira alors que 
l'on a une hférarchie indicée. 

Une hiérarchie indicée est une hiérarchie stratifiée sur 
laquelle on a défini une fonction réelle V qui est telle que : 
Vxel V (x) = 0 (les classes à un seul élément ont un 
indice nul). 

Ac B—= V (A) < V (B) [l'indice voit sa valeur aug- 
menter à mesure que l'on s'élève dans l'arbre]. 

On démontre que toute hiérarchie indicée induit sur E 
une distance ultramétrique en prenant : 


d (i,j) = Min{V (A) | A€EH,/EA,je A} VijeE 
d (i,j) est l'indice de la plus petite classe contenant à la 


la, b,c, d,e) 


fois / et /; c'est encore l'indice du premier nœud rassem- 
blant à la fois / et /. Réciproquement on démontre qu'à 
toute distance ultramétrique correspond une hiérarchie 
indicée équivalente (induisant la même ordonnance) à la 
famille des hiérarchies indicées associées à une même 
hiérarchie stratifiée. 

Ceci montre tout l'intérêt de la distance ultramétrique. 
Pour construire un arbre de classification, on cherche à 
approcher l'indice de proximité par une distance ultramé- 
trique. On démontre que parmi toutes les ultramétriques 
inférieures à d (indice de proximité) il en existe une supé- 
rieure à toutes les autres (ultramétrique sous dominante 
de d) et que c’est la plus proche de d pour n'importe quelle 
distance entre indices de dissimilarité. Divers algorithmes 
sont utilisés. 


Procédés opérant par dichotomies 

L'objectif est toujours d'obtenir une partition de E 
en classes qui regroupent les éléments qui se ressemblent 
le plus, mais cette fois en opérant par fractionnements 
successifs de l’ensemble E. 

Partitionner E en deux classes équivaut à définir une 
application booléenne sur E (application qui prend la 
valeur 1 pour les éléments d'une classe et la valeur 0 
pour les autres). Il paraîtra logique de définir une « dis- 
tance » (au sens indice de proximité) entre classes puis de 
choisir parmi les 27 — 1 1 applications booléennes celle 
qui maximise la distance entre deux classes. Le même 
procédé permet de fractionner les deux classes obte- 
nues, etc. (fig. 16 et 17). On obtient ainsi une segmen- 
tation de l'ensemble E. 

Un des inconvénients consiste en ce que deux indivi- 
dus séparés lors de la première dichotomie seront très 
éloignés alors qu'ils diffèrent peut-être seulement par le 
premier caractère ayant servi à établir la séparation. 

Là encore divers algorithmes ont été proposés, trop 
nombreux pour que nous puissions en rendre compte ici. 


I 


dichotomie 


Richard Colin 


RÈGNES 


EMBRANCHEMENTS 


CLASSES 


ORDRES 


FAMILLES |. 


GENRES Ornithorhynchus 


ESPÈCES 
(ornithorynque) 
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Orycteropus 


Ornithorhynchus anatinus  Orycteropus afer 
(oryctérope) 
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À Tableau récapitulatif 
des différentes méthodes 
utilisées en analyse 

des données. 


<« Figure 16 : 
représentation simplifiée 
d'une partition 

par dichotomies. 


<« Figure 17: 

illustration tirée du tome | 
la Taxinomie, 2e édition, 
1976, de l'ouvrage 
l'Analyse des données 

par J.-P. Benzecri et coll. 
(Dunod). 
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CALCUL NUMÉRIQUE 


De tous temps l'homme a cherché à calculer, mesurer, 
évaluer les phénomènes auxquels il s'est trouvé confronté. 
Les géomètres de l'antique Égypte étaient chargés de 
mesurer la surface des champs que périodiquement le Nil 
recouvrait d'un limon salvateur et bienfaisant. Pour cela il 
leur fallait non seulement avoir imaginé un instrument de 
mesure (chaîne d'arpenteur, etc.), mais encore disposer 
d'une méthode permettant de calculer la surface d'un 
champ quelle qu'en soit la forme. Cette méthode ne 
pouvait exister que fondée sur un support théorique solide 
c'est-à-dire sur la géométrie. La géométrie leur démontrait 
que tout polygone pouvait se décomposer en triangles, la 
méthode consistait à déterminer la formule donnant la 
surface d'un triangle; restait la mesure proprement dite 
qui, se réduisant ainsi à une succession d'opérations élé- 
mentaires de simple manutention, pouvait dès lors être 
confiée à quelques travailleurs d'outre-Nil. 

Le calcul numérique était né de cette confrontation 
entre un corps de théorie (le cas échéant créé pour la 
circonstance), et un problème réel. L’avènement de 
l'informatique et l'irruption des ordinateurs dans le monde 
du XXe siècle ont permis au calcul numérique de connaître 
un développement sans précédent. Ce développement est 
à l'évidence commandé par le nombre croissant de pro- 
blèmes qui, aujourd'hui, dans de multiples domaines 
(physique, technologie, économie, recherche opéra- 
tionnelle, etc.), suggèrent une formalisation mathématique 
et, subséquemment, une résolution numérique aussi 
rapide et précise que possible. 

Songeons par exemple au programme « Apollo » et 
notamment à la première expédition sur la Lune de juil- 
let 1969 : la trajectoire du vaisseau spatial, sa vitesse à 
chaque instant, l'angle de sa rentrée dans l'atmosphère,etc., 
sont autant de grandeurs mesurables qui sont obtenues 
au terme de calculs mathématiques très élaborés, et qu'il 
doit être possible de faire de manière instantanée si les 
circonstances (même les plus imprévues) l’exigent. Tous 
les paramètres sont calculés à partir d'un modèle mathé- 
matique global décrivant toutes les relations qui existent 
entre eux, ainsi que les équations qui les régissent. Grâce 
à ce modèle, il est possible de prévoir l'évolution du 
système. 

L'homme de la rue a quelque peine à imaginer la 
complexité d'un tel modèle, mais il peut percevoir que la 
démarche des techniciens et ingénieurs de la N. À. S. A. 
reste au fond très semblable à celle des géomètres égyp- 
tiens : le passage d’un problème réel à sa résolution pra- 
tique se fait toujours en trois étapes : la mise au point du 
modèle mathématique décrivant (au mieux) le problème 
réel (ici le modèle doit faire appel aussi bien à l'astronomie, 
à la balistique, à l'électronique, qu'aux mathématiques), la 
mise au point de la méthode (ou algorithme) pour 
conduire les calculs, enfin l'é/aboration du programme 
informatique, c'est-à-dire la traduction de l'algorithme en 
un langage accessible au calculateur électronique. La 
chaîne d'arpenteur est devenue ordinateur. 

Il est certain que ces trois étapes restent étroitement 
complémentaires : les possibilités de l'informatique as- 
treignent tout algorithme à certaines contraintes que l'on 
ne peut négliger (coût du temps de passage, capacité de 
mémoire, etc.). De même les progrès de la recherche ma- 
thématique sont indispensables pour la résolution de 
nouveaux problèmes (notamment dans le domaine de 
l'analyse numérique, c'est-à-dire l'étude des équations 
aux dérivées partielles). C'est précisément cette deuxième 
étape qui est le champ d'action du calcul numérique. Le 
calcul numérique est donc la science de l'algorithme. 


Définition d'un algorithme 

Un algorithme est une suite d'opérations élémentaires 
(en général algébriques) qui conduit à la résolution 
(exacte ou approchée) d'un problème. Un algorithme est 
donc formé d'une succession d'étapes (ou itérations) qui 
s'enchaînent de manière logique. 

La solution sera exacte ou approchée suivant la nature 
du problème posé. Un calcul est dit exact lorsque la solu- 
tion recherchée est donnée de manière analytique, c'est- 
à-dire à l'aide d'une formule composée d'opérations algé- 
briques connues (par exemple : la recherche des racines 
d'une équation du deuxième degré, l'inversion d'une 
matrice, etc.). Le calcul approché répond, quant à lui, à 


l'émergence de problèmes plus complexes dont il n'existe 
pas de solution analytique. On cherche donc à se rap- 
procher de la solution théorique avec une précision choi- 
Sie à l’aide d'un a/gorithme convergent mais qui ne l'attein- 
drait qu'en un nombre infini d'itérations (recherche de 
racine d'une équation de degré > 2, calcul d'intégrale par in- 
terpolation, résolution d'équations différentielles non linéai- 
res ou aux dérivées partielles, recherche d'optimum, etc.). 
Exemple : donnons un exemple simple qui, illustrant 
ce type de méthodes, donne une idée des difficultés qui 
peuvent surgir. Considérons l'équation à une inconnue : 


(1) g (x) =x 


où g est une fonction numérique. Géométriquement, la 
solution est l’ensemble des points d'intersection de la 
courbe y = g (x) avec la première bissectrice. Partant 
d'un point x, il est facile de construire le point x1 = g (xo) 
puis x2 = g (x1), etc. Sur la figure 1 il est clair quel'on défi- 
nit ainsi une suite x, à l'aide de la formule récurrente 
Xn +1 = 9 (Xr) et que cette suite converge vers x*, solu- 
tion du problème posé. 
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A Figure 1 : 

un algorithme est une suite 
d'opérations élémentaires 
qui conduit à la résolution 
d'un problème; 

la formule récurrente 
Xn+1= g(X2) définit une 
suite x, qui converge 

vers X*. 


« Page ci-contre, 
une des salles du centre 
de contrôle de la N. À. S. À, 


<« Figure 2 : en prenant 
comme valeur initiale 

x, Ou X;, l'algorithme 
converge vers « mais 

il n'est pas possible 

de trouver une valeur 
initiale qui le fasse 
converger vers 8 qui est 
également solution 

de g (x) = x. 
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Tableau synoptique 

du principe de la méthode 
des éliminations 
successives. 


L'algorithme ainsi décrit est un processus itératif (ou à 
approximations successives). À chaque étape de l'algo- 
rithme, on se rapproche de la solution, on détermine le 
résuitat de l'étape n — 1 à l’aide de celui de l'étape n. 

Il est aisé de voir que si l'algorithme converge et si, en 
outre, la fonction est continue, alors la limite x* de la 
suite xn est solution de l'équation. Mais la convergence 
elle-même suppose que la fonction y vérifie certaines 
hypothèses. De surcroît, cette convergence peut dépendre 
de la valeur initiale choisie. 

Ainsi, dans le cas représenté sur la figure 2, en prenant 
comme valeur initiale de x; ou x, l'algorithme converge 
vers « mais il n’est pas possible de trouver une valeur 
initiale qui le fasse converger vers 8 qui est également 
solution de l'équation (1); de plus, en x” le processus 
diverge! La convergence d'un algorithme va donc dé- 
pendre des propriétés mathématiques des concepts qui 
interviennent dans sa définition. Mais d'un point de vue 
pratique, il est important de pouvoir connaître en outre la 
vitesse de convergence dudit algorithme. La vitesse de 
convergence peut par exemple être mesurée par le nombre 
d'itérations nécessaire pour passer d'une valeur initiale xo 
à une valeur contenue dans un voisinage de rayon € de 
la solution x*. Si la vitesse de convergence est trop faible, 
il pourra être nécessaire de changer l'algorithme ou de 
modifier celui-ci afin de diminuer le temps de passage sur 
l'ordinateur. 

Nous venons de voir un exemple simple où la solution 
était un nombre. Dans certains problèmes plus généraux, x 
représente un vecteur de RP où même une fonction. Ainsi 
la résolution d'une équation différentielle peut être appro- 
chée par un processus (méthode dite d'Euler par exemple). 
Pour parler de convergence d'un tel algorithme, il faut 
qu'au préalable on ait défini non seulement l'espace fonc- 
tionnel dans lequel on cherche à s'approcher de la solu- 
tion mais encore que l'on ait muni cet espace d'une 
norme ou d'une distance (c'est donc dans le cadre de 
l'analyse fonctionnelle [voir Analyse fonctionnelle] qu'on 
pourra replacer ce type de problèmes). 


Erreur 

Considérons un processus itératif du type de celui 
donné en exemple, où x désigne plus généralement un 
vecteur ou une fonction, c'est-à-dire mathématiquement 
un élément d'un espace vectoriel topologique (par 
exemple normé), la suite x, converge donc vers la solu- 
tion x*, autrement dit: lim |xx—x*|= 0 

A 

Supposons que l'on arrête le processus à l'itération N, 
alors l'erreur absolue commise en prenant xx comme solu- 
tion approchée est : 


En =|xx—x" |; 
l'erreur relative est alors donnée par 
ol —x| 

"7 1 


Ne connaissant pas x*, il s’agit de trouver des majora- 
tions de e», ex (ne dépendant pas de x*) de manière à 
évaluer une borne supérieure de l'erreur (absolue ou 
relative) commise en arrêtant l'algorithme à l'étape N. 
Là encore, les majorations possibles dépendent des pro- 
priétés mathématiques de l'algorithme considéré. 


Méthodes de résolution d'un système 
d'équations linéaires 


Considérons le système de n équations à 7 inconnues 
suivant : 


(au X1 +. + din Xn = Di 
À 821 X1 + + 89 Xn = b2 
Vans X1 + … + Ann Xn = bn 


. . . La > 
En définissant la matrice A et les vecteurs x et b par: 


411. din & X11 + bi 
A D Hml El ml L 
An1 Ann Xn bn 


On peut mettre le système sous forme matricielle 
k d > 
AX = b. 
D'après ce qui a été vu en algèbre linéaire, cette équa- 
. Se . . > ä . 
tion matricielle a une solution unique x* si, et seulement si, 
le déterminant de la matrice A est non nul {système dit de 
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Cramer); la solution cherchée est alors obtenue en inver- 
sant la matrice A : X* = À 1h. 

Une méthode d'inversion de matrice a déjà été donnée 
(voir Algèbre linéaire) : elle oblige à calculer un grand 
nombre de déterminants (7? déterminants d'ordre n — 1) 
ce qui rend le calcul particulièrement fastidieux lorsque n 
est grand. D'un point de vue pratique, il est préférable 
d'utiliser d’autres méthodes plus opérationnelles. II en est 
de deux types : 

— les méthodes exactes qui sont des algorithmes 
finis de calcul de solutions (méthode de Gauss, méthode 
du pivot) ; 

— les méthodes itératives, analogues à l'exemple 
développé dans le chapitre précédent, qui permettent 
d'obtenir les solutions, avec la précision voulue, à l'aide 
de processus convergents infinis (méthode des approxi- 
mations successives, méthode de Seidel, méthode de 
relaxation). Les approximations (erreurs d'arrondis, etc.) 
inévitables font que même les résultats des méthodes 
exactes sont approchés: l'utilisation des méthodes ité- 
ratives donne lieu, de surcroît, à l'erreur inhérente à la 
méthode. Notons d'ores et déjà que l'efficacité des 
méthodes itératives va dépendre du bon choix de la 
valeur initiale et de la rapidité de la convergence du pro- 
cessus. 


Soit donc à résoudre le système : 


(2% + 8% + x3 = 4 (a). 
X1 — X2—2%X3— 1 (b) 
| xX1+4x2+ x3=1 (c) 
Étape 1 : on divise l'équation (a) par le 
coefficient de x1 dans cette équation. D'où 
l'équation (a’): on élimine x1 des équa- 
tions (b) et.(c) en retranchant à chacune 
d'elles l'équation (a’) : 


3 1 ; 
A+3X%2+35%= 2: (e”) 
1 5 / 
ny ee, (b”) 
5 1 ñ 
3%2+3%3=—1 (c’) 


Étape 2 : on conserve l'équation (a’): on 
élimine x2 de l'équation (c’) en divisant 
l'équation (b°’) par le coefficient de x2 dans 
cette équation; d'où l'équation (b”). On 
élimine x2 de (c’) en retranchant de cette . 


équation l'équation (b”) multipliée par e. 


3 1 , 
A+3sxt5x— 2 (a’) 
x2+5x3— 2 (b”) 

— 12 x3 = —6 (c”) 


Étape 3 : ce système est sous forme dia- 
gonale ; il admet pour solution : 


| 
X1 = 3 
+ 
= 2 
= 
2 


Méthode des éliminations successives 
ou méthode de Gauss 

La méthode consiste à remarquer que la résolution d'un 
système linéaire mis sous forme diagonale est facile à 
résoudre. 


Exemple : 
2X1+X2—X3— 1 (2) 
3X2+Xx3— 4 (3) 
3 x3 = 3 (4) 


De l'équation (4) on tire x3 = 1 que l'on reporte dans 
l'équation (3) pour obtenir la valeur de x2 = 1; l'équa- 


1 4 
tion (2) donne alors celle de x1 (- 5) L'a/gorithme de 


Gauss consiste à mettre le système à résoudre sous forme 
diagonale en procédant à certaines combinaisons linéai- 
res des équations, de manière à éliminer une ou plusieurs 
variables. Ces combinaisons successives s'effectuent sur 
les coefficients du système; à chaque étape, dans la 
pratique, on se contente d'écrire les coefficients, sous 
forme de tableaux. 

Voyons le principe de la méthode sur un exemple que 
nous résoudrons de manière synoptique à gauche par 


l'élimination successive des variables, à droite par la : 


manipulation des tableaux des coefficients (ci-dessous). 


On voit donc déjà apparaitre la notion de pivot. La 
méthode du pivot que nous présentons maintenant est 
donc une forme améliorée de la méthode de Gauss. 


Méthode du pivot 


La méthode du pivot consiste à mettre le système sous 
forme diagonale en effectuant des combinaisons linéaires 
des lignes analogues à celles qui interviennent dans la 
méthode de Gauss. 

Exemple : nous reprenons l'exemple précédent en 
utilisant la disposition pratique sous forme de tableaux 
que nous avons introduits : 


Tableau 0 : 
3 114 
1 1 —2 | 1 
1 4 L | 1 


Le premier pivot étant choisi (ici le coefficient de x1 
dans la première équation), la méthode consiste à pro- 
céder à des combinaisons de lignes de manière à faire 
apparaître un à la place du pivot et des O à la place 
des autres coefficients de la première ligne. Le tableau 1 
s'obtient donc de la même facon que dans l'exemple 
précédent : 


à 
à 


Tableau 1 : 
1 È 5| : 
ET]. << 
- p ait 


On prend comme deuxième pivot le coefficient de x2 
dans la deuxième équation (on aurait tout aussi bien pu 
prendre la troisième équation). On multiplie la deuxième 


' ; 3 è 5 
ligne par — 2 puis par — 5 (respectivement — s) pour 


l'ajouter ainsi transformée à la première (respectivement 
troisième) ligne de manière à faire apparaître des O en 


' Si. 0 ; es 
lieu et place de 5 et -; on obtient ainsi le tab/eau 2 : 


2 
Tableau 2 : 
1 (e) — 7 — 1 
0 1 5 2 
(0) (e) — 12 — 6 


En prenant comme troisième pivot et en pro- 
cédant de la même façon, on aboutit au tableau 3 : 


Tableau 3 : 

5 

1 (0) 0 35 

1 

(o) 1 0 | — 5 

1 

(o) (o) 1 3 

La solution du système est là encore : 

jme La 
1 2? X2 2° 3 Pl 


Exemple : cette méthode est également utilisée pour 
calculer l'inverse d’une matrice donnée. Donnons-en le 
principe sans en fournir la justification théorique. Sur 
l'exemple précédent, il suffit d'appliquer la méthode du 
pivot au tableau suivant : 


2 3 lu [LA 0 0 
1 À —2 |0 1 0 
1 4 4 110 0 1 


En prenant successivement les éléments diagonaux du 
bloc de gauche comme pivots, on obtient au bout de la 
troisième étape : 
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À Avantages comparés 
des 3 méthodes proposées 
en fonction du nombre 

n d'inconnues. 


3 1 V4 
1 0 0 1 TE) RÉ 
1 1 5 
0 1 Pie D) D 
1 5 1 
LE D 


Le bloc de droite du tableau ainsi obtenu est la matrice 
inverse de la matrice cherchée. 


Avantages comparés des méthodes proposées 


Du point de vue de l’utilisation, la meilleure méthode est 
celle qui donne lieu au plus petit nombre d'opérations 
élémentaires (addition, multiplication). Il est possible de 
calculer le nombre N d'opérations requises dans l'appli- 
cation des 3 méthodes, en fonction du nombre » d'in- 
connues. Ë 


Pour n > 4, on a les inégalités Nÿ © Ny < Nc. Ainsi 
la méthode de Gauss semble préférable pour la résolu- 
tion de gros systèmes linéaires : supposons que l'on ait 
à résoudre un système de 10 équations et que l'on utilise 
un calculateur qui effectue 104 opérations par seconde. 
Le temps T nécessaire pour résoudre le système est dans 
les 3 cas: Te 24 heures! Ty 2 l/10 sec. Tr © 4 1/10 sec. 
On comprend pourquoi la méthode de Cramer n'a aujour- 
d'hui qu'un intérêt académique. 


Méthode des approximations successives 


Lorsque le nombre des inconnues devient trop impor- 
tant, l'application des méthodes exactes que nous venons 
de voir s'avère bien trop compliquée. On leur préfère 
alors des méthodes numériques approchées. L'une d'elles 
est la méthode des approximations successives : 


> ea 
Considérons le système linéaire (5) : Ax = b. Il est 
Fe 
toujours possible de trouver une matrice H et un vecteur & 


tels que (5) devienne (6) : FE Hx + &. Si A est la 
matrice (a), on vérifiera sans peine que la matrice H 
est égale à: 


22, _ 2 Es 
411 411 a11 
> 
H = 0 et k — 
__ fn 0 Pn 
Ann Ann 


Cette transformation est toujours possible si la matrice A 
est inversible. En effet, on peut supposer qu'alors les 
éléments de la diagonale sont tous 0, quitte à modifier 
l'ordre des lignes ou des colonnes. On choisit une valeur 
initiale 
X0 = [x9, …, x0] (en général on prend X0= (0,... 0, 0)). 

> > 
On calculera x1 par la formule x1 — Hx9 + k. A la j-ième 


$ 
H 

* : LA Me à : > " 

itération, on aura xi*l— Hxi + k. Si le processus 


> ES 
converge vers une limite x*, alors il est clair que x* est 
solution du système considéré. Pour que l'algorithme 
converge, il faut et il suffit que toutes les valeurs propres 
de la matrice H soient en modules inférieures à 1. Cette 
condition est assurée lorsque les coefficients diagonaux 
de la matrice À sont, en module, plus grands que la 
somme des autres éléments de leur ligne (et leur colonne) : 
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œil > A Xij 
j ki 
Exemple : soit à résoudre le système : 
10 x1— 2 X2— 2 x3 = 6 
— X1 + 10x2— 2 x3 — 7 
— X1 — Xx2 + 10 x3 = 8 
le système s'écrit sous la forme (6) : 


Le processus converge vers la solution (évidente) 
x = X5 = x$ — 1, sans l'atteindre en un nombre fini 
d'itérations. Cependant, il faut noter que ce processus 
itératif jouit de la propriété d'autocorrection : une erreur 
de calcul isolée ne perturbe pas le résultat final, une appro- 
ximation erronée étant toujours considérée comme un 
nouveau vecteur initial. On peut apporter quelques amé- 
liorations à cette méthode de manière à accélérer la 
convergence du processus : tel est l'objet par exemple de la 
méthode de Seidel, qui consiste essentiellement à tenir 
compte, lors de la k-ième approximation de l’inconnue x, 
des k-ièmes approximations des inconnues X1, ….,xi -1 
déjà calculées. Il existe d'autres méthodes (méthode de 
relaxation par exemple) qui sont exposées dans la litté- 
rature spécialisée. 


Résolution approchée des systèmes 
d'équations non linéaires 


Position du problème 


Le cas linéaire que nous venons de traiter recouvre 
un grand nombre de problèmes. II n’en reste pas moins 
que certains phénomènes physiques sont régis par des 
relations non linéaires. D'où l'importance que l'on est 
en droit d’attacher aux méthodes de résolution de tels 
systèmes. 

Soit donc le système de n équations à n inconnues : 


fi (Xi, Xn) = 0 
fa (X1, …, Xn) = 0 


fn. (Ki: Xn) = 0 
On peut représenter le système sous la forme abrégée 


usuelle : f (x) = Ô où f désigne l'application de R7 — R7 
définie à l'aide des applications fi: 


f1 (ce) 
f(°) = É | 
fn (°) 


Les méthodes qui existent sont assorties de conditions 
particulièrement contraignantes sur la fonction 7. C'est 
dire que ce genre de méthodes ne répondra qu'à une 
classe assez limitée de problèmes. Nous présenterons 
deux algorithmes de résolution : la méthode de Newton 
qui fait appel au calcul différentiel et la méthode des 
approximations successives qui généralise celle que l'on 
a rencontrée dans le cas linéaire. 


La méthode de Newton 


Cette méthode s'inspire aussi des principes de la 
méthode des approximations successives : elle définit 


. s' . . > 
un algorithme qui à chaque itération donne une valeur x(P) 
approchée de la solution, qui sert également au calcul 


de l'approximation suivante X@ +2, Cherchons à établir 


la règle de calcul. On peut écrire XP +1) = KE) + EG), 
Nous allons chercher à déterminer e(?) de telle façon que 


æ 
xt? +1) vérifie « le mieux possible » la condition f (x) = 0, 
ce qui s'écrit 

(7) F (RD) = f (KE) + E@)) = 

On suppose que la fonction f est continûment dérivable 
dans un certain domaine Q convexe et ouvert de [R7. 


On peut donc définir la matrice jacobienne de l'appli- 
cation f: 


h. 
ns (), D. (69 
W (x) = : k 
Lo 2% 
Ox1 x OXn 


Transformons (7) en écrivant le développement limité 
CA : Lt 
(vectoriel !) de la fonction f au voisinage du point x(?) : 


F (RG) + er) = f (XP) + W (XP) : 
e@) + O0 ([E2)) 


En nous bornant ainsi au premier terme du développe- 
ment limité, nous pouvons écrire l'égalité suivante qui 
constitue une approximation de la condition (7) : 

F[X@)] + W (KE) : EG) = 0 


en supposant que la matrice W (X@)) est _inversible 
(lorsque X(?) n'est pas un point singulier de la fonction f) 


on obtient : 2(?) = —W (X(?))-1 -f(X(2)) ;parconséquent 
on obtient le vecteur x(? +1) selon la règle : 
(8) KG +1) = (D) — W-1 (XCD) - f [XP] 


Exemple : soit le système : 


x? +xB+ x —=1 
2x? + x3— 4 x3 = 0 
3x?—4x2+ x3 = 0 


On part du vecteur initial x@) = x(9) = x@) = 0,5, d'où 
— 0,25 
l'on obtient f (x(0)) — Ë 126] 
— 1,00. 
La matrice jacobienne W 62) est donnée par: 


2x1 2x2 2x3 
W (X) = É X1 2x 4 
6x1 —4 2x3 
1 1 1 
Ona W (x(O) — G 1 4) 
3 —4 1 
nie À 
8 8 8 
7 1 3 
—1 (3(0)) = | — er re 
MODS D 2 
11 + RU 


20 40 40 
On calcule ainsi X() par la forme (8). Le résultat des 
trois premières itérations est donné dans ce tableau : 


Il va sans dire que la convergence de l'algorithme n'est 
pas toujours assurée et que certaines conditions portant 
sur l'application f et sur la valeur initiale X(0) doivent être 
réalisées. Ainsi que nous l'avons déjà vu en introduction, 
la limite de l'algorithme peut dépendre de la valeur initiale. 


Il s'agit donc également d'étudier la stabilité de la solution 

par rapport à x). 

La méthode des approximations successives 
Soit à résoudre un système non linéaire de la forme 


X1 —= Q1 (x1, ser Xn) 


Ram On (cr #0) 

que l'on peut écrire sous forme abrégée 
— 
(9) x =  (X) 


la solution X* de cette équation, si elle existe, est un point 
fixe de l'application ©. On cherche à savoir à quelles 
conditions on peut obtenir x* comme limite du processus 
itératif défini par: 


(10) 
Définition : l'application © de À & IR? — R? sera dite 


contractante dans A s'il existe une constante a:0 <a <1 
telle que 


X@+D = (xt) 


le (1) —9 (x)|< a bi— x Vxy x E A 

où | {| désigne la norme euclidienne usuelle de R?. 
Si l'application ® est contractante dans À, partie fermée 
de R?, alors le processus itératif défini en (10) converge 
vers un vecteur X* solution de (9). En outre, cette conver- 
gence est indépendante du choix de la valeur initiale XO). 
Enfin l'erreur absolue commise en stoppant la procédure 
à l'étape p est majorée selon la formule : 


> + > Oo < aP 
Re — x] LE xD — 07. 


a 
La solution X* est alors unique. La méthode des approxi- 
mations successives peut être également appliquée au 
système général (11) 7 62) = Ô. Considérons le système 
(12) X+1D=X 

Toute solution de (11 )estsolution de (12).Onpeutdonc 


espérer dans certains cas [c'est-à-dire au voisinage de la 
solution x* de (11 )] appliquer cette méthode au cas général 
———— — 


en posant © (x) = ÿ + f ($). 


Optimisation 


Position du problème 
Un problème d'optimisation consiste, d'une façon 
générale, à déterminer la valeur x* d'un vecteur X de Re 
maximisant — ou minimisant — une fonction objectif f ©. 
D'autre part le vecteur X* est assujetti à appartenir à une 
certaine partie K de R? : 7 (X) = Opt f (x) 
XE 


où f:Rr—=R 


Suivant la nature de l'ensemble K on aura affaire à des 
types de problèmes différents. On distinguera trois cas : 
— K= R7: il s'agit alors d'un problème d'optimi- 
sation sans contraintes ou de recherche d'un optimum 


libre ; 


— Kest défini par des contraintes de la forme : 
K={ReRT) g (%)=b j=1,…p}: 


il s’agit alors d'un problème d'optimisation sans contraintes 
d'égalité; 
— Kest défini par des contraintes de la forme : 


K={eRr/g (x <b; j=1,.p} 


il s’agit dans ce cas d'un problème d'optimisation sous 
contraintes d'inégalité. 

Notons au préalable qu'il est toujours possible d'expri- 
mer un problème de maximisation sous la forme d'un 
problème de minimisation — et réciproquement. En effet, 
on peut toujours écrire : 


Max f (X) = — Min [— 7 (X)] 


Nous restreindrons donc notre exposé au problème de 
la maximisation. La théorie mathématique va nous per- 
mettre de connaître les conditions portant sur la fonction f 
et sur l’ensemble K qui assurent l'existence (et l'unicité 
dans certains cas) d'une solution au problème : 
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> Tableau récapitulatif 
des méthodes 

les plus couramment 
utilisées dans les problèmes 
d'optimisation. 


Max f (X) 


Fa 
*eK 


(13) 


Théorème : 
— Sifest une fonction continue et si l'ensemble K 
est une partie compacte de R* (c'est-à-dire fermée et 


bornée), alors il existe au moins une valeur X° de X solu- 
tion de (13). 

— Si de plus la fonction f est strictement concave 
et si l'ensemble K est convexe, alors la solution X* est 
unique. 

La première assertion n'est rien d'autre que l'expression 
du théorème de Weierstrass (voir 7opologie). 

> = 
Démontrons la seconde : supposons que x* et ÿ* soient 
à Cet ü > . 
deux solutions distinctes de (13). Soit z un point du 
SC 5 
segment joignant x* à ÿ” :Z peut se mettre sous la forme 
2= "+ H3X)7" où XEIOAT 

f étant strictement concave, on écrit : 

> RAD à _ > % à > % _ > + 
F2) = Qt + (1 —2)y*) > A (x*) + (1 — 2) F (y*) 

> 
orf(X*)=#f (ÿ*) par conséquent f (2) > f(x')etx* ne 
serait plus solution de (13). Pour résoudre numérique- 
ment le problème (13), il existe deux classes de méthodes 
que l'on retrouvera dans les 3 cas que nous venons de 
distinguer : d'une part les méthodes directes qui utilisent 
des conditions nécessaires d'optimalité qui s'obtiennent 
en employant certaines caractérisations issues du calcul 
différentiel; d'autre part, les méthodes itératives qui 
= é . Le , # = 

consistent, partant d'un point xo réalisable (c'est-à-dire 
appartenant à K), à définir une suite de points de K 
Re X tels qu'à chaque étape on « améliore » la fonction 

s ” > . 
objectif: (Xo) < © (X1) … < © (Xy) < … Sila procédure 
converge, on est en droit d'espérer que la limite soit solu- 
tion du problème (13). Encore faudra-t-il s'assurer que 
l'on n'obtient pas ainsi un optimum local qui dépendrait 
de la valeur initiale. Les méthodes itératives diffèrent 
entre elles par la procédure employée pour passer d'un 

La 


Le D 
point x, de l'algorithme au suivant x,:1. En général, 
> + 


#- > 
on cherchera x»: sous la forme xv21 = xy + & * dy 


— 
où € R et dy est un vecteur de R* qui représente une 
direction admissible choisie de telle facon que, en la sui- 
vant, on augmente la valeur de la fonction f; #, représente 
le « pas » du déplacement que l'on détermine de manière 
à améliorer réellement la fonction f (une trop grande 
valeur de #, pourrait conduire à une décroissance de f) 
tout en restant dans le domaine admissible K. Le tableau 
ci-dessous résume les méthodes les plus couramment 
utilisées dans les problèmes d'optimisation . 

Nous n'évoquerons ici qu'une partie des méthodes de 
ce tableau. En particulier, nous n'aborderons pas ici 
la programmation linéaire (et la programmation quadra- 
tique) qui fera l'objet de développements ultérieurs 
(voir Mathématiques et science économique). 


Optimisation sans contraintes - Méthode directe 
Soit donc le programme suivant : 
(14) Max f (x). 


x e R? 


Nous supposons que la fonction objectif fest de classe C2. 


Montrons qu'une condition nécessaire pour que x soit 
un maximum de f s'écrit 
&f 

15 (x )=Q =; 
(15) 2x C9) n 
Cette condition n'est en effet nullement suffisante puis- 
qu'elle serait également vérifiée pour un minimum ou 
pour ce que l'on appelle un point-selle. En outre elle est 
une condition nécessaire d'optimalité locale. 

Au voisinage de x*, on écrit le développement de 
Taylor de la fonction f à l'ordre 2 : 

à + à 4 Œ — > 

16 FX — h)—F(x*) — — (x*) hi +0 (A1. 
A D D LS 

En appelant vecteur gradient le vecteur Vf (X*) de 


© > @ > cf 
composantes Es CRE Chers 
êx1 êx2 EXn 


| on réé- 
crit l'égalité (16). 
(7) F Ge 2 hr Ge) = VE ) À + 0 (AD, 


où « * » désigne le produit scalaire dans R*. Dire que x* 
est un maximum local, c'est dire qu'il existe un voisinage 


V () tel que : 
1 +h<r() Vhev (). 


> 
Pour | | suffisamment petit (c'est-à-dire inférieur à « 
fixé à l'avance) il vient: 


(18) VF) -h<O Vh |hl<e. 


Il est clair que cette inégalité entraîne VF (x*) — Ô. En 
effet, il suffit d'écrire l'inégalité (18) successivement 
pour À = (0, h:,… 0) et (0, 0,— h;,… 0) pour ÿ 
variant de 1 à n. 


FE) = Max f (= VF (7) = à. 
xeR* 


La recherche du maximum peut donc se ramener à la 
résolution du système (15). A cet égard, pour résoudre le 
système, on peut développer une de ces méthodes pré- 
sentées dans le chapitre précédent. Comme nous l'avons 
dit, rien n'indique que la résolution d'un tel système 
conduise à une solution du problème de maximisation. 
Les deux problèmes ne sont pas équivalents. La seule 
chose que l'on puisse affirmer, c'est que l'ensemble des 
solutions (14) est inclus dans celui des solutions de (15). 


Optimisation sans contraintes - Méthode du 
gradient 


La méthode du gradient est une méthode itérative qui 
est fondée sur les considérations suivantes : soit un 


5 
point xo de R*. Certains déplacements À au voisinage 
de ce point vont produire un accroissement de la fonc- 
tion . Nous pouvons caractériser ces déplacements en 
écrivant la formule (17) : 


f (ko A) —f (xo) = VF Go) : À + O (|h|) 
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<« Figure 3 : la fonction f 
augmentera pour tout 


déplacement ñ 


Cptimisation sous contraintes d'égalité - 
Multiplicateurs de Lagrange 
Soit à résoudre le problème d'optimisation suivant : 


Richard Colin 


Au premier ordre, l'on peut dire que la fonction f 
> . 
augmentera pour tout déplacement h suffisamment petit 


———+ > > 
vérifiant : VF (xo) * À > 0, c'est-à-dire pour tout vecteur h 
faisant un angle aigu avec le vecteur gradient (f#g. 3) : 
le déplacement qui assure le plus grand accroissement 
de la fonction est celui qui correspond à la direction du 
gradient lui-même. 

La méthode du gradient consiste donc, à chaque ité- 
ration, à suivre la direction du gradient aussi longtemps 
que la fonction augmente : plus précisément, à l'itération v 
on se trouve en un point X. On cherche Xo +1 sous la 
forme : 


> > 
Xo s1=X +4 VF (%) beR 
t est la valeur du pas qui donne la plus grande valeur 
. . . Re A 
de la fonction f selon la direction grad f (x»). Autrement 
dit, & est solution du problème de maximisation à une 
variable : 
Max té + t VF (%)) 
teR 
Exemple : soit à résoudre le problème de maximisa- 
tion à 2 variables x1 et x2 
Max f(x1, x2) = — (x1—2)2— 2 (x2— 1)? 
(x1, x2) € R? 
La solution est bien sûr évidente : x* — 2 et x; = 1. En 
tout point x les composantes du vecteur gradient sont 
données par 
(= (Ki) 
|— 4 (x2—1) 


VF (x) = 
Partons d'une valeur initiale X0 — (0): VF () = (a) 
On détermine to qui maximise f [(0) + t ()]: soit : 
d - 1 
LÉ = 2 ANT = HS 
ne [(4é— 2)? 2 (4t—1)2] = 0, cequidonnet 3: 
4 
On a donc x — 


&I BR IR 


. On calcule ici VF (x1) = : 
3 


puis 1, etc. 
Les calculs correspondant aux trois premières itéra- 
tions sont rassemblés dans le tableau suivant: 


Cette méthode comporte les avantages et les inconvé- 
nients de toutes les méthodes itératives tels que nous les 
avons évoqués dans les chapitres précédents. L'exemple 
que nous venons de développer ne pose quant à lui aucun 
problème d'unicité puisque la fonction objectif choisie 
est une fonction concave. 


Max f 69) n>m SORTE petit _ 
los 5 = b; D 0 vérifiant : V f(x) -h> 0. 
î PJ mn less 
que l'on peut réécrire sous une forme vectorielle : 
Max f 69) 
> > > 
1g (9) = b 


où g représente une application de R? — R?? et b un 
vecteur de R”. L'idée qui vient immédiatement à l'esprit 
consiste à tenter de se ramener à un problème sans 
contraintes en exprimant certaines variables en fonction 
de n — m variables libres à l'aide des m contraintes d'éga- 
lité. Cette démarche est directement fondée sur le théo- 
rème des fonctions implicites; l'application de ce théo- 
rème en un point X*, maximum local, permet (sous les 
bonnes hypothèses) de trouver des considérations néces- 
saires d'optimalité qui généralisent donc celles que nous 
avons rencontrées dans le paragraphe consacré à la 
méthode directe : le développement de cette méthode 
aboutit à définir des coefficients réels 24, …, }m (ou un 


> 
vecteur À de R”#*) pour chaque contrainte, que l'on 
appelle multiplicateurs de Lagrange, et à introduire une 


> 
fonction nouvelle : L (x1, …, Xn, 21, …, km) notée L (x À), 

Fra > > > me = LÀ > 
définie par : L (x, À) = f (x) — > 25 [gs CO — b;] 

JS 
: > (> > > > > 

ou mieux :L (x, à) = f (x) — 2: (g (7) — b). 

La condition nécessaire d'optimalité s'exprime en écri- 
vant que X* doit satisfaire les contraintes : 


(19) g (X)—b = 0 
et que le gradient (par rapport à x) du /agrangien est nul : 
(20) VF (x) — 7: Va (x*) = 0. 


On peut regrouper les conditions (19) et (20) sous 
une forme plus condensée : 

PE Le + 

( Va L (x*,À*) = 0. 

(21) gs > 

Ù VAL ce, 27) = 0. 
Il s'agit d'un système de n — m équations à n + mincon- 
nues X1, .…, Xn €t À, …, Am. On notera la symétrie que 


> — 
ces formules accordent à x et à À; celle-ci traduit le fait 
qu'un problème d'optimisation peut se formuler dans le 
cadre plus général de la dualité. Nous retrouverons ce 
point de vue dans le chapitre Mathématiques et science 
économique. 

La méthode des multiplicateurs de Lagrange, qui, 
répétons-le, ne fournit qu'une condition nécessaire d'opti- 
malité, a été généralisée dans le cas de contraintes d'iné- 
galité, c'est-à-dire pour résoudre un problème de la forme: 


Max f (X) 
CA CO Sbsj=1.::m 
xiZz0 i=,:f 


Notons la contrainte de positivité des variables. On définit 
alors, de manière analogue, une série de m coefficients 
appelés :11, …, um, appelés multiplicateurs de Kühn et 
Tücker, et qui permettent de définir un ensemble de 
conditions qui généralisent (21). 
Maximisation sous contraintes d‘'inégalité - 
Méthodes itératives 
Méthode Rosen (gradient projeté) 
La méthode du gradient projeté s'applique au cas où 

les contraintes sont linéaires : 

Max f (X) 

> > 

Ax < b 

£ 

x2>0 

ss 

A représente une matrice (m, n) et b un vecteur de R?. 


La méthode s'inspire des principes de la méthode du 
gradient adaptée à la recherche d’un optimum libre : 


partant d'un point réalisable x0, on « améliore » la 
fonction objectif en se déplaçant suivant la direction 
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Y Figure 4: 

voir développement 
dans le texte 
Méthode Rosen 
(gradient projeté). 


do = Vf Co). 


On se déplace tant que la fonction objectif croît et tant 

que l’on n'atteint pas une contrainte (la contrainte sera 

dite alors saturée, mais il peut y en avoir plusieurs). 

Si l'on atteint une contrainte en un point X1, on calcule 

le vecteur VF (a) que l'on projette sur la ou les contrain- 
> 


tes saturées. La projection di ainsi déterminée fournit la 
direction du déplacement de l'itération suivante. En fait, 


: . E > 
une fois calculé le vecteur gradient VF (xo) = àv, on 
considère uniquement sa projection sur l'ensemble des 


. F4 = A à 
contraintes saturées en Xxv qui « empêcherait » de prendre 
> > 
la direction 5, : ainsi, sur la figure 4, en x1, si le gradient 
de f est égal à &, on ne projettera pas sur la contrainte 1, 
>, 


mais on gardera le déplacement #. 

Certains artifices de calcul matriciel permettent, à 

chaque itération, de calculer explicitement le vecteur 
> 

projection, c'est-à-dire la direction dy à suivre pour 

atteindre Xvz1. La linéarité des contraintes assure la 

convexité de l’ensemble des points admissibles. 

D'autres méthodes sont couramment pratiquées pour 
la résolution de problèmes d'optimisation. Elles s’inspirent 
toutes des mêmes arguments que celle du gradient pro- 
jeté. Lorsque les contraintes ne sont plus linéaires (par 
exemple convexes, de manière à assurer la convexité 
de l’ensemble des points réalisables), la recherche de 


> > 
directions admissibles d, à partir d'un point réalisable xy 
est beaucoup plus délicate : il est alors extrêmement 
malaisé de se déplacer sur des contraintes non linéaires 
car cela nécessite une série de calculs d’une rare com- 
plexité. Il existe principalement deux types de méthodes 
pour résoudre ce genre de problèmes : la méthode des 
directions admissibles, et celle des pénalités. 


Méthode des directions admissibles (Zoutendijk) 
Si, lors d'une itération, on se trouve sur la frontière du 


Le 
domaine en un point x» on déterminera la direction 
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& 
admissible d, qui fait revenir à l'intérieur du domaine, 
c'est-à-dire que l’on ne se déplace plus selon la direc- 


. . > . . + 
tion du gradient Vf (x) mais selon une direction @ 


. # “ge La > £ . 
qui vérifie VF (x) * dy > 0, de telle facon, néanmoins, 
que l’on reste dans le domaine des points réalisables. 


Méthode des pénalités 

La méthode des pénalités est une méthode assez lar- 
gement utilisée dans la pratique. La formulation la 
plus courante semble en être celle de Fiacco-Mac Cor- 
mick. Sans entrer dans les détails, donnons le principe 
de ce genre de méthode. Soit donc un problème d'opti- 
misation du type : 
(22) Max f (X) 

> 
gi (x) > 0 
Les contraintes de positivité des variables sont incluses 


dans les fonctions g: ©. La méthode consiste à modi- 
fier la fonction objectif d'une certaine manière, de façon 
à remplacer le problème initial (22) par une séquence de 
problèmes sans contraintes (que l'on peut résoudre par 
une méthode du type gradient) dont les solutions conver- 
gent vers l’optimum recherché. Le principe de pénali- 
sation revient à modifier la fonction objectif en y faisant 
figurer les fonctions qui définissent les contraintes de 
telle sorte que l'on soit « fortement pénalisé » si l'on 
s'aventure en dehors du domaine réalisable 


P = {k/gi (©) > 0}. 
Considérons par exemple la fonction de pénalité définie 


par : 
> 
em={L Aa 


On modifie alors la fonction objectif de la manière sui- 
vante : 


m 
a > 
PH = (+ D © [g (X] 
J=1 
Si l'on cherche à minimiser sans contraintes la fonc- 
tion Ÿ, on a de fortes chances de rester dans le domaine P : 
si l’un des g; (%) devient < 0, alors ® [g; (] devient —00 
et la violation d'une contrainte est de ce fait fortement 
pénalisée. Il serait prématuré de crier victoire et de croire 
que l'on peut ainsi remplacer tout problème d'optimi- 
sation avec contraintes par un problème sans contraintes. 
En effet la fonction Ÿ n'est pas continue puisque la 
fonction ® ne l'est point. Impossible donc d'utiliser une 
méthode de gradient, car, dèsquel’onatteintune contrainte, 
on ne peut plus calculer le gradient. On est donc tenu 
de choisir une fonction de pénalisation continue; par 
exemple : 
0 y 20 
AL ne y<0 


Mais dans ce cas, on peut s'attendre à ce que certaines 
contraintes soient violées car la « pénalisation » n'est pas 
suffisamment forte. Pour éviter donc le plus grand nombre 
de ces violations, on pondère largement par un coeffi- 
cient K > O en posant: 


m 
(23) Max @ +K > Cl Gi] = Max (X K). 
= , > 
J=1 x 
La méthode consiste à résoudre le problème (23) pour 
différentes valeurs de K : on considère une suite décrois- 
sante : Ko > Ki > … > Ko > Ks=1; 
> > 
soit x* (Ko), x* (K1), …, x* (Ky) les solutions corres- 
pondantes du problème (23). La présence de la pénali- 
sation nous assure que tous ces points sont intérieurs 
" > 

au domaine P. Il reste à espérer que la suite x* (K) 
converge vers la solution X* du problème initial (22). 

lim x* (Ks) = x*? 

V— 

lim P Lx* (Ky)] = 7 (x*)? 

V— co 
Cette convergence est réalisée si, entre autres, les fonc- 
tions f, g; et ® vérifient certaines hypothèses de convexité 
et de différentiabilité. 


Approximation - Interpolation 


Les fonctions les plus connues et les plus utilisées 
dans les calculs sont celles qui sont données de manière 
analytique et qui peuvent être calculées par des ordina- 
teurs à l’aide des opérations élémentaires préprogram- 
mées. 

Ainsi en est-il de la fonction polynôme (de degré n) : 


(24) 7n (X) = 40 + a1X + a2X? + … ax" 
des fonctions rationnelles de la forme : 
80 + 81X + … AnX* 
R2 (x 
en (6) bo + b1x + … bnx? 


ou encore des polynômes trigonométriques : 
1 n 
(25°) Ta (9 = 3 80 + bi (ax cos kx — bx sin Kx). 
k=1 


Il arrive que, dans la pratique, l'on se trouve en présence 
de fonctions que l'on ne peut exprimer sous forme analy- 
tique de manière simple et opérationnelle. Il arrive aussi 
que l'on ne connaisse la fonction que par les valeurs 
qu'elle prend en un nombre déterminé de points X1, …, Xn. 
Ces valeurs sont données dans un tableau (26) du type : 


Yn41= f (Xn+1) 


Si l’on souhaite calculer la valeur prise par la fonction 
en un point x£ x;, il faudra se contenter d'une valeur 
approchée. Pour cela on cherchera à remplacer la fonc- 
tion f par une fonction connue aisément calculable, 
un polynôme 7» (x). On pourrait tout aussi bien cher- 
cher des fonctions du type (25) ou (25°). Le tout est de 
choisir un polynôme +» (x) de telle sorte qu'il ne soit 
pas trop « différent » (dans un sens à préciser) de la 
fonction f. À cet égard, on peut envisager deux types de 
méthodes : l'approximation et l'interpolation. 


L'approximation 
Nous avons eu déjà l’occasion de rencontrer (voir Ana- 
lyse des données) un exemple d'approximation : la 
régression linéaire. Plus généralement, on peut chercher 
à « approcher » les points (xi, y:) par une courbe du 
2°, 3° ou m-ième degré (fg. 5). Il s'agira donc de déter- 
miner le polynôme 7, (x) = a5 + afx -- … a, x" qui 

ñn 

minimise la distance euclidienne > 
i=1 


[Yi — 7m (xX)]2. 


Appelons ® (az, 42, …, am) cette expression; le problème 
revient donc à résoudre le problème d'optimisation : 
Min 


Gi, … Am € R* 


(0) (az, a2, …, 8m). 


On se trouve donc en présence d'un problème sans 
contraintes que l’on résoudra en usant des méthodes décri- 
tes dans le chapitre précédent. 


L'interpolation 


Étant donné un tableau tel que (26), on cherche à trou- 
ver un polynôme rx» (x) tel que : 


Tm (Xi) = f (x) Vis, sin 


Autrement dit, il s’agit de faire passer la courbe de la 
fonction 7» (x) par tous les points (x;, y:) [fg. 6] : 

Il est possible de démontrer que le polynôme de plus 
bas degré passant par n + 1 points est, au plus, de degré n. 
Nous allons donner la formule d'interpolation de Newton. 
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Pour cela, il nous faut introduire quelques notions limi- 
naires. 


Dérivées discrètes d'ordre h 

_Étant donné deux points du tableau x4, x; +1, nous défi- 
nirons la dérivée discrète du premier ordre f [xi, Xi +1] par 
la formule : 
_ f Cxix1) —# (x) 


F TX, xXi+1] 
Xi+1— Xi 


Étant donné maintenant 3 points xX;-1, X, Xi+1, NOUS 
définirons la dérivée discrète du deuxième ordre 
F Lx 1, Xi, Xi+1] 


ESTENEPELIE ZEUS: 


! ul Fe 
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« Figure 5; 
l'approximation : courbe 
de la fonction r2 (x). 


« Figure 6; 
l'interpolation : courbe 
de la fonction 3 (x). 
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de la manière suivante : 
Flxisa, x] — f Lx, Xi 1] 
Xi+1— Xi 
Plus généralement, étant donné # +— 1 points 


F[xi-1 Xi Xis1] = 


(Xi, Xisu, … Xi+k+1) 
on appellera dérivée discrète d'ordre Kk l'expression : 
FIX, Xi, , Xi+k+1] = 
Flxies …, Xispe1] — [x …, Xi+#] 
Xi+k+1—X 


Formule d'interpolation de Newton 
Considérons la dérivée discrète première sur l'inter- 
valle [x, x1] : f (x) = f (x1) + (x — x1) f [xu, x] ; on peut 
remplacer f[x1, x] par f[x2, x1] + (x — x2) f [xz, X2, x]: 
en continuant ainsi le procédé, on obtient l'égalité : 
FX) = f Ga) + (x — x) F [xx Xe] + 
(x — x1) (x — Xx2) F [xa, x, X3] + … + 
so Ce Xn) ee (KR xn) F UK 5 Xp]  E (9 
où E (x) estle reste qui est égal à 
(x — x1) … (X— Xn +1) F Cxx  Xn +1, X]. 
Ainsi donc, on peut écrire la formule d'interpolation de 
Newton : 
Zn (9 = F (x) + (x — x1) F Cxi, Xe] + + 
(X— Xx1) (x — Xm) F [Xe Xn +1] 


7n (x) est un polynôme de degré n qui passe par les n + 1 
points (x, :). La procédure de calcul du polynôme 7; (x) 
se simplifie notablement lorsque les points x; sont répartis 
selon des intervalles réguliers sur [a, b] : 


X2— X1 = X3—X2 = — Xni1—Xn = K. 
On peut définir alors la différence finie du premier ordre Ay:; 
par : 

Ayi = yi— ira = f(x) —f (x 1): 
et à l'ordre n: 

Any; = AN ly; — Anly; 1. 

La formule de Newton s'écrit alors, en partant du point 
(Xn +1: Yn +1) 


ÂYn+ 
Fn (x) = Yn+1 + (x — Xn+1) mt — 
An 
(27) (x = Xnxt) (= x) PE re 
Ans 
(X— Xn+1) … (X— x2) ET 
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Applications au calcul d'intégrales 

Les méthodes d'interpolation et d'approximation que l‘on 
vient d'étudier dans les paragraphes précédents sont d’une 
grande importance dans le calcul numérique des intégrales 
définies. Soit donc une fonction f (x) donnée sous forme 
analytique, dont on ne connaît pas de primitives mais 
dont on souhaite calculer l'intégrale sur un intervalle 
[a, b] (a > — 00, b < + co) 


= [7 60 due 


On peut chercher une valeur approchée de Ï: pour cela, 
on découpe l'intervalle [a, b] selon n intervalles égaux 
Ex, Xi +1] tels que xi+1 = X+x 
_ b—a 
__n+7) 


La méthode consiste à choisir une bonne interpolation f 


de la fonction f sur [a, b] et à prendre comme valeur 
approchée de | la somme : 


X1= 8, Xn+1 = D k 


rb L fxi+1s 
Drome D [700 
Ja i=1" 7% 

Par exemple on pourra prendre pour fonction fle poly- 
nôme 77 (x) donné par la formule (27). L'on obtient 
ainsi : 


PTT E 09 dx = 
fXi+1 (x— b) , 
| Xi [f (b) + En (b) +— 
(x— b) (X— x) ua: 
ge (b) + … + 
= es je) LS Gr 
EE an 5 (0) ] + 


é, 
[.f_ En (9 dx 
J't-1 


Sil'on pose x = b + «k (x < O0), 


Pxi + 1 
| F (x) dx = 


J Xi 


- 2 2 . ”. : 

HORERUOEECEEOECTOE ere, 
kn+2 ir 

(n+1)1Ji-m+r 


Cette formule est connue sous le nom de formule de 
Newton-Cotes. On peut l'établir d'une manière plus géné- 
rale en calculant les coefficients du polynôme en un 
point quelconque du découpage Cé 1 (%)). Cette for- 
mule permet également de connaître une majoration de 
l'erreur commise grâce à la donnée du dernier terme. 


a (a+ 1) + (a+ n)f+D (E) du 


Intégration des équations différentielles 


Position du problème 


Un des problèmes les plus couramment traités en 
calcul numérique est la résolution d'équations diffé- 
rentielles du type : 

dx 


(28) [= x @ = #1x e]| 


X (to) = Xo 


Les conditions d'existence et d'unicité d'une solution 
x* (t) de ce type d'équation ont déjà été présentées et 
sont connues (voir Analyse). Il arrive fréquemment que 
l'équation différentielle (28) ne relève pas d'un type 
connu (linéaire, de Riccati, etc.). L'on ne possède donc 
aucune formule analytique permettant d'en obtenir la 
solution. L'on cherche alors une solution approchée de 
l'équation; différentes méthodes de résolution existent 
ainsi qui, toutes, sont fondées sur le principe suivant : 
on commence par « discrétiser » l'intervalle [éo,é] sur 
lequel on veut intégrer l'équation (28) en le subdivi- 


y 
N 


4 t 
sant en N intervalles de longueur À = au moyen 


de N —+ 1 points intermédiaires fo, {1, … avec & = fi -1 + h 
et ix — t. 

On cherche à attribuer à tous ces points une suite de 
(N + 1) valeurs Xo, X1, .…, XX qui constituent des approxi- 
mations des valeurs prises par la solution x* (£) de 
l'équation (28). On obtient ainsi un tableau (29) des 
valeurs approchées : 


to Xo 
(29) HO 7 
x Xx 


Toutes les méthodes consistent à déterminer la valeur 
Xn-1 à partir des valeurs Xo, …, Xn grâce à une relation 
du type : 

Xn 1 = F (Ko, Xi Xn+1: NF). 

La méthode sera dite implicite si F ne dépend pas de 
Xn1: Xn21 = F (Ro, Xi Xn, 1, f) ; elle sera dite explicite 
dans le cas contraire. Les méthodes diffèrent dans le 
choix de la fonction F. Cette fonction ne peut être choisie 
de manière arbitraire : elle doit satisfaire notamment 
certaines conditions de compatibilité avec l'équation (28) 
et de convergence. 


Conditions de compatibilité . 
Les valeurs approchées (Xo, x1, Xx) ne coïincident pas 
en général avec les valeurs théoriques exactes 


(XGre XX)  Lxn = x° (tr)] 
et donc la quantité /nz1 = Xxñ+1—F (xG, Xi, x) 


In + 
* ©1éera appelé erreur de 


est 0. Le rapport rx +1 = 


troncature locale à la (m — 1)-ième étape. Une méthode 
sera dite compatible avec l'équation différentielle (28) 
si elle satisfait aux conditions : 


(a) F (Xo, X1 … Xn+1; n, 0) = 0 
(b) [F (Ro Xnac: nf) —F (Ko. Xn+1: n,f)| 
n+i 
<CD%-X%|;C>0 
i=0 
Max |:| 


(c) lim r—0 où +— 
1I<i<N—1 


h0 


La qualité + mesure l'erreur de troncature de la méthode ; 
elle mesure la qualité de l’approximation choisie. Il est 
certain que, dans le cas général, ni 5» +1, ni /r +1 ne sont 
donnés sous forme analytique. L'on ne peut en connaître 
que des majorations qui permettent cependant d'établir 
la condition (c). 


Conditions de convergence 

Soit une approximation du type (29) de la solution. 
On appellera erreur absolue à l'étape (n + 1)-ième la 
quantité : En +1 = Xn+1— Xn+1 n = 0,…, N—1. 

Il est clair que l'erreur absolue dépend avant tout de 
l'erreur de troncature à l'étape (7 + 1). Que la méthode 
soit compatible ne signifie par pour autant que : 


(30) lim e—0 avec e — Max |ei|. 
h=0 


Ocic<N 
En effet, l'erreur d'approximation commise à l'étape n 
se propage à l'étape n + 1; aussi l'on peut avoir simul- 
tanément : 
lim += U lim /= + co. 
h-0 h_,0 


Dans un tel cas, la méthode sera dite divergente. Elle 
sera convergente si la condition (30) est réalisée. 
Méthodes multisteps 


Les méthodes multisteps font appel à des fonctions F 
linéaires, c'est-à-dire de la forme : 


Fr à 
(31) You D &Xn-i+h D bifn-i 
i=0 i=i 


où a; et b; sont des coefficients réels et 
fn-i=f(n-itn-i). 


On démontre que les méthodes multisteps sont compa- 
tibles et convergentes. 


[e] 
Ê = 
ce 
Li 
ra 
; 
(= 
Ê 
= 
© 
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La méthode « one step » dite méthode d'Euler 
est la plus connue et la plus simple : 


Xn 1 = Xn + hf (Xn: fn). 
Écrite sous la forme : 
AXn +1 
h 


cette égalité n'est autre que la « discrétisation » de 

l'équation différentielle (28) (c'est-à-dire que l'on rem- 

dx NZ +1 
n 


= à (Xnr tn) 


place la dérivée ae Per la dérivée discrète 


la définition des méthodes multisteps plus générales, on 
fait intervenir les valeurs prises lors des n étapes précé- 
dentes. On obtient alors les coefficients a; et b; de la 
formule (31) en écrivant la formule de Newton-Cotes. 
On peut en effet écrire l'équation différentielle (28) 
sous forme intégrale : 


(32) x (6) = x (to) + F Ex (x), +] dr 


). Dans 


La méthode de « différence centrale » : 
Xp +Li—= Xn-1 + 2% fn 
La méthode d'Adams : 


n " h 

Xn=1 = Xn — 24 [55 fn — 59 fn-1 + 37 tisse fn] 
Une méthode du quatrième ordre : 

& Æ h 

Xn+1—= Xn FT (9 fn-1 — 19 fn — 5 fn-1 + fn-2) 


Notons que cette dernière méthode est une méthode 
implicite puisque fr :0 dépend de Xx +1. Il existe encore 
d'autres méthodes multisteps. 

La méthode d’Adams-Brashforth est une combi- 
naison de la méthode d'Adams et de la méthode du qua- 
trième ordre que l'on vient de donner. Il existe encore 
d'autres méthodes multisteps. 

En dehors des méthodes multisteps, mentionnons 
la méthode dite de Runge-Kutta dont le principe 
consiste à approximer la valeur prise par la dérivée 
en Xn 1 par un développement de Taylor de la fonction f 
en X». L'ordre de ce développement peut être aussi élevé 
que l’on souhaite ; sous certaines conditions, cette méthode 
est une méthode convergente. 
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LOGIQUE 


Le terme « logique » est un des plus multivoques que 
la tradition philosophique nous ait légués. Il n’est guère 
plus précis que « métaphysique » ou « morale ». C'est 
pourquoi l’on est souvent tenté de ie préciser soit en 
l'attribuant à quelque auteur de système, comme lorsqu'on 
parle de la logique d’Aristote, de la logique de Kant, ou 
de la logique de Hegel, voire de la logique de Husserl, 
soit en indiquant de quel type de logique il s'agit, comme 
lorsqu'on dit « logique modale », « logique intuitionniste », 
ou « logique plurivalente », etc. 

Notre terme s’appliquait donc à des matières aussi 
diverses, parfois même franchement hétérogènes. Mais 
aujourd'hui on l’applique à une discipline qui est un genre 
de mathématique, et à travers elle, à un objet qui n'est 
précisément autre que la mathématique elle-même. Autre- 
ment dit, c'est une manière de parler mathématiquement 
des mathématiques, mais une manière qui a des exigences 
propres, c'est-à-dire qu'on ne l'obtient pas par simple 
extension du langage mathématique à un domaine nou- 
veau. 

Mais si le sujet concerné par la « logique mathématique » 
n'est pas des plus faciles à définir, les logiciens mathéma- 
ticiens s'y arrêtent aussi peu que les mathématiciens eux- 
mêmes s'arrêtent sur l'objet de la mathématique. L'accord 
entier est réalisé sur des techniques que les débats philo- 
sophiques, toujours ouverts, n'entament point. Car, aussi 
intéressantes et profondes qu'elles puissent sembler, les 
techniques n'exigent en réalité que des langages qui 
soient compatibles avec elles, ce qu'on peut satisfaire 
sans se lier par un langage unique. En revanche, un mini- 
mum de points sont acquis dès le départ : comme, par 
exemple, que la logique mathématique étudie des langues 
formalisées, c'est-à-dire des objets reproduisant une 
structure mathématique, qu'elle ne prétend par consé- 
quent nullement refléter toute la richesse de la langue 
naturelle, qu'elle n'’investit pas non plus les modalités 
du « nécessaire », du « possible » ou du « réel » sur lesquels 
on n'est pas encore parvenu à une clarté suffisante malgré 
d'énormes progrès réalisés dans les dernières discussions 
à ce sujet, que la logique mathématique classique admet 
comme un principe logique sain le principe du tiers 
exclu, qu'elle ne refuse pas, moyennant les précautions 
requises, l'usage de l'infini dans les mathématiques 
classiques. 
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C'est dire que la logique mathématique s'est élaborée 
en restreignant le domaine de ses investigations et sa 
curiosité aux questions qu'elle pouvait résoudre mathé- 
matiquement; c'est par des renoncements qu'elle est 
devenue une discipline rigoureuse, précise, et féconde. 
Comment ? C'est ce que nous allons exposer. 


Histoire de Ja logique 


Chacun sait que le système à la fois le plus ancien et le 
plus représentatif du sens que nous donnons aujourd'hui 
au terme « logique » est la théorie du syllogisme créée par 
le philosophe grec Aristote qui a vécu de 384 à 322 avant 
J.-C. On a tenté de remonter au-delà d'Aristote pour 
retrouver les éléments qui auraient mis ce dernier sur la 
voie de sa découverte. Mais toutes les recherches effec- 
tuées dans cette direction sont demeurées indécises. Le 
mieux qu'elles établissent est ce que nous savons déjà : 
que l'art de la discussion, le souci d'en formuler les prin- 
cipes, d'en articuler les degrés, de préciser toujours la 
conclusion à laquelle on veut arriver et le point duquel 
on part avaient déjà conduit à isoler certains principes du 
raisonnement logique et à former une habitude, consciem- 
ment cultivée, du sens logique. La première trace s'en 
trouve déjà dans le poème de Parménide, qui nie au nom 
de la cohérence logique tout ce qu'Héraclite prétendait 
enseigner à partir de l'expérience directe, opposant ainsi 
ce qui est matière d'opinion et ce qui doit relever de la 
science. C'est le commencement d'une dialectique phi- 
losophique fondée sur une méthode rigoureuse aboutis- 
sant, en mathématiques, et en mathématiques seulement, 
à des conclusions définitives, grâce au même procédé 
que Platon désigne par l'expression « par hypothèse » 
(È£ 5roBsosuc), et qui vise à établir un rapport purement 
logique entre certaines propositions. 

Cependant rien ne permet de dégager de l'œuvre de 
Platon un système de logique aussi explicite que la théorie 
aristotélicienne du syllogisme. Celle-ci ne forme qu'une 
partie de l'œuvre logique d'Aristote qui occupe plusieurs 
volumes groupés sous le nom d'« Organon » et compre- 
nant : 

— les Catégories qui traitent la théorie des termes; 

— De l'interprétation, consacré à la théorie des pro- 
positions ; 

— les Premiers Analytiques où théorie du syllo- 
gisme proprement dit; 

— les Seconds Analytiques où théorie de la démons- 
tration, c'est-à-dire du raisonnement scientifique ; 

— les 7opiques où théorie du raisonnement dialec- 
tique ; 

— Ja Rhétorique où théorie du discours à effet ora- 
toire. 

L'ordre de ces traités ne reproduit pas celui de leur 
genèse historique, et les titres n'en sont pas, pour la 
plupart, le fait d'Aristote lui-même. Par exemple, Aristote 
a écrit les Catégories (de zx7nyoo£iv qui signifie : attri- 
buer quelque chose à quelqu'un ou quelque chose) et une 
partie des 7opiques avant d'avoir élaboré sa théorie du 
syllogisme. C'est qu'il se proposait une enquête générale 
sur les conditions du discours et sur la nature de l'attri- 
bution ; mais, en affirmant que toute proposition revient à 
un jugement qui se compose d'un sujet et d'un attribut 
reliés par l'intermédiaire du verbe être, il doit préciser les 
diverses fonctions que peuvent remplir les termes : s'ils 
peuvent être, d'une part, sujets ou attributs, ils désignent, 
d'autre part, une substance (homme, cheval), où bien 
indiquent le temps, le lieu, la qualité, la relation, etc. 

Les Premiers Analytiques donnent d'abord une défini- 
tion du syllogisme; c'est, suivant Aristote, un discours 
« dans lequel certaines choses étant posées, une autre 
en résulte nécessairement par le seul fait que celles-là 
sont posées ». Apparemment, cette définition implique 
l'idée même d'inférence correcte, sous-jacente au concept 
d'hypothèse selon Platon, qui visait à préciser la notion 
de conséquence logique. Mais en fait, elle est plus restric- 
tive : la définition des prémisses que donnent les Pre- 
miers Analytiques conduit à une classification élémentaire 
en quatre types; « une prémisse est une proposition qui 
énonce quelque chose sur quelque chose d'autre de 
manière affirmative ou négative » (24 À 16). Sachant que 
toute proposition nous dit si un attribut appartient 
(B appartient à tout À) ou n'appartient pas (B n'appar- 
tient à aucun A) au tout, propositions universelles affir- 
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matives ou négatives, on peut avoir une partie seulement 
du sujet (B appartient à quelque À ou n'appartient pas 
à quelque A) ; d'où la division des propositions qui cons- 
tituent les prémisses aussi bien que la conclusion d'un 
syllogisme en propositions universelles, affirmatives ou 
négatives, et particulières, affirmatives ou négatives, sym- 
bolisées depuis les Scholastiques par les lettres a, e, j, o 
(a, { pour les propositions affirmatives [de affirmo]; 
e, o pour les négatives [de nego]. SaP équivaut à « tous 
les S sont P »: SiP à « quelques S sont P »; SeP à «nul S 
n'est P »; SoP à « non tous les S sont P ») et ayant entre 
elles les rapports logiques qu'illustre le fameux carré : 


Aucun homme 
n’est juste 


Tout homme 
est juste 


contraires 


4 @ 
FA £ 
= Q, 


s91181}U09q 


œ 
Le 
sd 
€ 
Q 
© 
£ 
2 
a 


contraires ne" 


o 


Quelque homme 


| Quelque homme 
est juste 


n'est pas juste 


L'aspect peut-être le plus important de la syllogistique 
d'Aristote est l’idée axiomatique qui l'anime. 

Aristote part des sy//ogismes dits de /a première figure, 
qui sont les plus parfaits, c'est-à-dire les plus « évidents », 
pour démontrer les modes d’autres figures par application 
de certaines règles. Par exemple, le syllogisme en Barbara 
de la première figure : si À est affirmé de tout B, et B de 
tout C, A est nécessairement affirmé de tout C est un syllo- 
gisme parfait dont la conclusion est immédiate étant 
donné la hiérarchie entre les termes À, B, C. 

D'autre part, le syl/ogisme de la deuxième figure : 
si M est affirmé de tout N mais d'aucun ©, O n'est affirmé 
d'aucun N (syllogisme en Camestres qui se réduit à 
Celarent) ; mais « M n'est affirmé d'aucun O » équivaut 
à « O n'est affirmé d'aucun M », ce qui permet de retrouver 
le deuxième mode de la première figure. C'est là une 
méthode directe de réduction d'un syllogisme concluant 
à un syllogisme de la première figure : mais on ne peut 
l'appliquer en toute circonstance. 

Considérons, par exemple, le syllogisme suivant (syllo- 
gisme en Baroco réduit par voie indirecte à Barbara) : 
si M est affirmé de tout N, mais non de quelque O, alors N 
peut ne pas être affirmé de quelque O, car, dit Aristote, 
s'il est affirmé de tout O et si M est affirmé de tout N, 
alors M est affirmé de tout O, contrairement à l'hypothèse 
qui nous dit qu'il n’est pas affirmé de quelque ©. Ce qui 
suppose le recours à un principe logique non explicitement 
posé : 


((PAOQ)—+R)< ((P A — R) + Q) 


Aristote montre donc que tous les modes de toute figure 
se réduisent, directement ou indirectement, à ceux de la 
première figure. Il rassemble en tout 14 modes concluants 
et exclut, par la méthode du contre-exemple, toutes les 
autres possibilités. 

La syllogistique d'Aristote montre donc à l'œuvre un 
esprit logique et axiomatique parfaitement conscient de 
ses tâches ; et c'est surtout le premier système logique qui 
utilise correctement des variables (de termes). Mais le 
champ d'application de cette logique est limité par la nature 
des propositions considérées; de plus, certains principes 
logiques effectivement utilisés restent tout à fait implicites ; 
enfin, comme Aristote, dans les Topiques et les Analy- 


tiques, ne considère les propositions et les syllogismes 
que comme les « images » produites dans l'esprit des 
autres par certaines expressions verbales, il ne distingue 
point entre les mots et les choses, entre un nom et ce qu'il 
désigne. 

Si Théophraste qui succède à Aristote (décédé en 322) 
à la tête du Lycée, n'apporte que des modifications de 
détail au système dont il a hérité, le premier stoicisme, 
dont la formation doit beaucoup à Euclide de Mégare, 
dit le Socratique, et à son école, manifeste pour la logique 
un intérêt que le stoicisme romain des |2" et [1° siècles 
perdra à peu près complètement, au profit de la morale. 
L'ancien stoicisme, dont le centre est situé à Athènes, 
au Ill siècle avant J.-C. s'est donc illustré, d'une part 
par les grands noms de Zénon de Cittium (336-264), 
de Cléanthes (331-232), de Chrysippe (280-210) à 
propos duquel on disait : « si les Dieux font de la dialec- 
tique, ils ne se servent pas d'une autre que de celle de 
Chrysippe », d'autre part par Philon, élève de Diodore, 
qui a défini le connecteur « si. alors » au sens exten- 
sionnel de l'implication matérielle. 

On peut dire que les stoiciens, dont nous ne connais- 
sons la doctrine que par ce que nous en ont rapporté 
Cicéron, Sextus Empiricus et Diogène Laërce, ont accompli 
une extension de la logique d'Aristote. Celui-ci utilisait 
« naïvement », pour prouver la validité ou l'invalidité des 
syllogismes, des lois logiques dont la syllogistique ne 
pouvait rendre compte; pour expliciter cette base impli- 
cite il fallait une logique différente, à la fois par sa structure 
et par son intention. En effet, les stoïciens ne s'intéressent 
pas seulement à la question de savoir si un prédicat 
convient à un sujet, mais à des propositions suscep- 
tibles en général d'être vraies ou fausses. Il en résulte 
d'abord une distinction entre le signe, le sens et la déno- 
tation : car une proposition peut être vraie ou fausse à 
condition de n'être pas confondue avec l'énoncé de la 
proposition qui n'est pas susceptible, lui, d'être vrai ou 
faux. Les stoiciens possédaient donc les rudiments d'une 
sémantique. 

Ensuite, en cherchant la facon dont les propositions 
s'impliquent mutuellement, ils isolent les différents 
connecteurs propositionnels. Sextus Empiricus nous rap- 
porte une sorte de table de vérité pour l'implication; il 
nous dit qu'il y a quatre manières de combiner les élé- 
ments d'une implication : antécédent vrai et conséquent 
vrai, antécédent faux et conséquent vrai, antécédent vrai 
et conséquent faux, antécédent faux et conséquent faux; 
l'implication n'étant fausse que si l'antécédent est vrai 
et le conséquent faux. 

Enfin, les stoiciens utilisaient des variables de propo- 
sition, et ont développé une conception déductive de la 
logique des propositions. Ce qu'on peut bien voir dans 
les schémas d'inférence correspondant aux anapodic- 
tiques de Chrysippe, c'est-à-dire à des propositions qui 
n'ont pas besoin de démonstration : 

(1) Si le premier, le second 
Le premier 
Donc le second 


justifiant, par exemple, le célèbre raisonnement : « s'il 
fait jour, il fait clair; or il fait jour, donc il fait clair ». 
(2) Si le premier, le second 
Non le second 
Donc non le premier 
illustré, par exemple, par « s'il fait jour, il fait clair; or il 
ne fait pas clair, donc il ne fait pas jour ». 
(3) Non à la fois le premier et le second 
Or le premier | 
Donc non le second 


par exemple : « il n’est pas vrai que Platon soit mort et 
vivant ; or Platon est mort, donc Platon n'est pas vivant ». 


(4) Le premier ou le second 

Or le premier 

Donc non le second, 
par exemple : « ou il fait jour, ou il fait nuit; or il fait jour, 
donc il ne fait pas nuit ». 
(5) Le premier, ou le second 
Non le premier 
Donc le second 


par exemple : « ou il fait jour ou il fait nuit, or il ne fait pas 
jour, donc il fait nuit ». 
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Mais ce ne sont là que les rudiments d'un système dont 
on est loin de connaître tous les éléments; suffisamment 
riche pourtant pour avoir éveillé un sens logique parfai- 
tement visible dans les efforts consacrés aux antinomies 
logiques dont celle du menteur : l'homme qui dit « je 
mens », s’il dit vrai, dit faux; et s'il dit faux, dit vrai en 
même temps. 

Parmi les diverses spéculations médiévales on ne trouve 
aucune innovation qui égale le système d'Aristote ou 
celui des stoiciens. En revanche la philosophie logique 
se développe avec Abélard (1079-1142), qui inaugure 
le problème des universaux, marque le point de départ 
de la méthode de discussion scolastique vulgarisée par 
les fameuses disputes, distingue entre l'implication vraie 
en vertu de sa forme et celle qui ne peut être vérifiée 
sans recours aux faits, analyse la copule « est » en vue de 
réduire tout énoncé catégorique à un énoncé de la forme 
«A est B ». 

Ockham, Buridan, Albert de Saxe et le Pseudo Scot 
ont continué cette réflexion au cours du XIVE siècle, 
en l’orientant essentiellement vers l'élaboration d'une logi- 
que de la déduction qui a abouti à un certain nombre de 
lois logiques correspondant à des théorèmes classiques 
du calcul propositionnel ; par exemple, « toute partie d'une 
conjonction suit la conjonction dont elle fait partie », 
c'est-à-dire « A À B — Ayet« A À BB ». 

On doit convenir que la logique « moderne » a très peu 
contribué à la formation de ce qu'on appelle aujourd'hui 
la logique. La Logique ou l'Art de penser d'Antoine 
Arnauld (1612-1694) et Pierre Nicole (1625-1695) a 
vulgarisé la distinction entre extension et compréhension 
d'un concept (entre l'ensemble des objets qui tombent 
sous lui et l’ensemble des attributs qui le composent). 
Mais on peut considérer que Joachim Jung et Arnold 
Genlinex, le premier par son influence directe sur Leibniz, 
le second par l'idée qu'il a maintenue d'une logique pure, 
ont perpétué l'exigence qui alimentera les différents pro- 
jets leibniziens. 

Gottfried Wilhelm Leibniz (1646-1716) est le premier 
qui soit allé plus loin dans le sens d’une logique comme 
langue artificielle susceptible de permettre la reconstruction 
de toute la pensée. C'est son projet d'une caractéristique 
universelle qui donne un contenu original à l'Ars magna 
de Raymond Lulle (1233-1315), constitue un début 
de réalisation de l'idée cartésienne de langue universelle, 
et inaugure une algébrisation de la logique dont le seul 
défaut est d'être restée ignorée. Leibniz, en effet, n'a pas 
publié le plus important de son œuvre logique qui ne vit 
le jour qu'après la naissance de la logique mathématique 
proprement dite, à la fin du XIX2 siècle. Jusque-là, on 
citait Leibniz davantage pour sa théorie de la connais- 
sance qui donne de celle-ci le schéma suivant : 


que pour ses essais logiques, bien que l'idée de connais- 
sance symbolique ne puisse être précisée que par une 
connaissance entièrement fondée sur une manipulation 
de symboles si réglée qu'elle semble aveugle, c'est-à-dire 
conforme à certaines règles fixées à l'avance et appliquées 
automatiquement, comme dans le ca/cu/ de l'identité 
algébrique (a +— b) (a — b) — a? — b?, où l’on pose : 
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a + b 
a —b 
a? — ab 

— ab — bp? 
a2 + O0 —b? 


Or l'idée d'établir la logique comme calcul résout l'anti- 
nomie inhérente à toute conception axiomatique de la 
logique puisque toute théorie axiomatique suppose déjà 
une logique ; les calculs au contraire n'en supposent pas. 

Bernard Bolzano (1781-1848) s'adonne également à 
desrechercheslogiques d'autant plus intéressantes qu'elles 
sont l’œuvre d'un précurseur de la théorie des ensembles, 
soucieux de démonstrations mathématiques rigoureuses, 
purement « analytiques », ce qui signifie pour lui d'abord 
purement logiques. Dans son œuvre monumentale, la 
Wissenschaftslehre, ce qui retient l'attention, c'est surtout 
son élucidation du concept d' « analyticité » en étroite 
liaison avec l'idée de validité universelle. Une proposition 
est universellement valide suivant Bolzano si le résultat 
de toute substitution à un élément déterminé de cette 
proposition donne une proposition vraie; elle est univer- 
sellement non valide si toute substitution de ce genre 
donne une proposition fausse. L’analyticité d'une propo- 
sition par rapport à un de ses éléments constituants, 
c'est sa validité où invalidité universelle par rapport à 
cet élément; mais en un sens plus restreint, une propo- 
sition est analytique si elle est analytique eu égard à tous 
ses éléments constituants, à l'exclusion des « termes » 
logiques. Mais Bolzano ne dispose d'aucun critère pour 
distinguer ce qui est « logique » de ce qui ne l'est pas. 
En revanche, ses définitions de la non-contradiction d'un 
ensemble de propositions et de l'implication formelle sont 
toutes modernes et annoncent les méthodes d'Alfred 
Tarski. 

La remise en chantier la plus considérable reste cepen- 
dant celle de l'école anglaise, avec essentiellement 
George Boole (1815-1864) et Augustus de Morgan 
(1806-1878), créateurs de l'algèbre de la logique. Tous 
deux étaient attentifs aux similitudes de structure entre 
lois logiques et lois algébriques. Les efforts de Boole 
culminent dans l’axiomatisation de Huntington (1874- 
1952). 

Le style algébrique de Boole, dont la seule différence 
avec Leibniz est, dit-on parfois, qu'il a publié ses travaux 
au contraire de celui-ci, ne prend les dimensions d'une 
véritable logique mathématique qu'avec l'œuvre de 


Richard Dedekind (1831-1916), dont le but explicite 
est de fonder les mathématiques sur une logique algé- 
brique suffisamment développée pour répondre aux 
finesses de l'analyse. Dedekind est le seul auteur qui 


donne, avant l'école italienne, toute son ampleur au style 
algébrique en logique, et cela grâce à sa théorie des sys- 
tèmes qui est une application originale de l'algèbre de la 
logique au problème des fondements des mathématiques, 
dans toute la richesse qu'il a à la fin du XIX® siècle. On 
peut certes dire que c'estavec Dedekind, et Golttiob Frege 
(1848-1925) mais d'un autre point de vue, que naït la 
logique mathématique moderne, comme discipline pro- 
pre, non plus orientée exclusivement sur l'algébrisation 
de la logique qui préoccupait Boole, mais sur l'ensemble 
des problèmes rencontrés en mathématique. 

L'entreprise de Frege illustre remarquablement l'exten- 
sion originale qu'est en train de prendre à ce moment notre 
discipline. On répétera, bien sûr, que Frege a été le 
premier à avoir élaboré un système axiomatisé du calcul 
des propositions, le premier à introduire les quantifica- 
teurs et surtout à en faire un emploi cohérent, le premier 
à concevoir une logique du second ordre avec quantifi- 
cation des variables de prédicat (ou de classe), mais son 
originalité profonde réside dans la façon dont il a fait 
l'analyse de certaines propositions qu'il a pris soin de 
« choisir » suffisamment complexes pour ne pas devoir 
chercher une extension, avérée impossible, des résultats 
obtenus sur des propositions simples à des propositions 
moins simples. Ayant profité du travail d'axiomatisation 
de l'arithmétique élémentaire, dû surtout à Hermann 
Grassmann (1809-1877), et des résultats d'Ernst Schrôder 
d'une part, de Karl Weierstrass (1815-1897) de l'autre, 
il a pu isoler l'élément essentiel dont la logicisation empor- 
tait d'emblée celle de l'ensemble de l'arithmétique, et, 
par voie de conséquence, celle de l'analyse. Il s'agit de 
l'induction mathématique, que l'empirisme régnant rédui- 
sait soit à un raisonnement par analogie, soit, directement 
ou indirectement, à une induction empirique. Hermann 
Lotze (1817-1881), dont Frege suivait les cours à 
l'université de Gôttingen, développa une critique vigou- 
reuse de ces vues empiristes. Mais le mérite de Frege reste 
entier en ce sens qu'il a constitué une logique du second 
ordre indispensable à l'insertion du principe d'induction 
dans un corps de propositions purement logiques. Cela 
a naturellement conduit Frege à élaborer les principes 
du calcul des propositions, à faire une étude du concept 
d'égalité, à montrer l'usage de la quantification, à déployer, 
enfin, en étroite connexion avec les exigences de cette 
dernière, une conception sémantique de la logique, c'est-à- 
dire une logique liée à une théorie de la vérité, la plus éla- 
borée qu'on connaisse avant la sémantique ensembliste 
de Tarski. Tout cela fait évidemment de Frege, non seule- 
ment le plus grand logicien de tous les temps, le Newton 
de la logique mathématique dont la fécondité est suffi- 
samment attestée aujourd'hui par le génie de Güdel et de 
Tarski, mais aussi le Descartes de la philosophie contem- 
poraine, sans lequel on ne comprendrait ni Wittgenstein, 
ni Carnap, de même qu'il serait impossible de comprendre 
Malebranche ou Leibniz sans référence à Descartes. 

L'œuvre monumentale de Bertrand Russell (1872-1970) 
et Alfred Whitehead (1861-1947), les Principia mathe- 
matica, a tiré le plus grand bénéfice des travaux de Frege, 
malgré l'absence d'influence directe. Elle combine le style 
frégéen à l'héritage reçu de l'école de Boole et enrichi 
par la grande synthèse de Schrôder. L'intérêt de ce monu- 
ment vient de ce qu'il fut publié après la découverte du 
paradoxe dit de Russell (et/ou de Cantor) sur les ensem- 
bles qui se comprennent eux-mêmes comme éléments; 
aussi est-il devenu la référence des travaux axés sur 
la question des fondements des mathématiques et marqués 
par une double orientation : axiomatique, celle-ci ayant 
permis, grâce à Hilbert, de montrer l'unité profonde de la 
géométrie et de l'arithmétique ensembliste, la théorie des 
ensembles ayant elle-même, avec Zermelo, fait sienne 
la méthode hilbertienne. C'est dans cette perspective, et 
en réponse au défi intuitionniste, que s'est formulé le 
fameux programme de Hilbert, par rapport auquel doivent 
être compris les premiers résultats de Güdel sur la complé- 
tude de la logique du premier ordre, aussi bien que sur 
l’incomplétude de la logique du second ordre, et par suite 
de l’arithmétique élémentaire. 


La logique mathématique 


Actuellement en logique on ne peut se passer de lan- 
gages formels. L'idée d’une formalisation du langage 
remonte à Leibniz, mais n’a été réalisée qu'avec la Begriffs- 


schrift (1879) de Frege. Non seulement la langue naturelle 
n'est pas assez exacte pour convenir à l'expression des 
données mathématiques, mais encore elle peut donner 
lieu à de dangereuses méprises. Mais l'idée de langage 
formel implique celle de son interprétation, ou de ses 
modèles. La théorie des modèles, qui n'a été constituée 
qu'après la découverte de la logique mathématique, per- 
met un exposé élémentaire très clair de la logique. La 
notion clef en est naturellement celle de vérité, dont la défi- 
nition fait le lien entre le langage formel et son interpré- 
tation, par l'intermédiaire des modèles; en effet, définir la 
vérité d'une proposition suppose donnés, non seulement 
la proposition elle-même, mais aussi le modèle dans 
lequel on interprète celle-ci (voir la définition plus loin). 

Une proposition A est vraie dans un modèle {, si dans 
le modèle At on associe la valeur « vrai » à la proposition A: 
AC constitue dans ce cas un modèle de la proposition A. 
Sinon A est fausse dans AC et AC n'est pas un modèle 
de A. Plus généralement AC est un modèle d'un ensemble 
de propositions © si AC est un modèle pour toute pro- 
position de l’ensemble Y. 


Le calcul des propositions 


Cette définition de la vérité étant préalablement posée, 
nous pouvons présenter succinctement le langage formel 
le plus simple, dénommé ca/cul propositionnel. Celui-ci 
est l'étude d'un ensemble d'énoncés simples tels que 
« Jean est sorti » ou « 2 + 2 = 4 » appelés propositions 
atomiques et d'énoncés plus complexes, obtenus en 
composant les énoncés simples à l'aide de mots de liaison 
appelés les connecteurs propositionnels comme 
«et », « où », « si... alors », etc. Au niveau le plus intuitif 
cet ensemble d'énoncés peut être interprété comme un 
« monde possible » où toute proposition est soft vraie 
soit fausse, et où la valeur de vérité de toute proposition 
complexe ne dépend que de la valeur de vérité des propo- 
sitions simples : on exprime cette dernière propriété en 
disant que les connecteurs considérés sont extension- 
nels. « Parce que » fournit un exemple simple d'une 
conjonction qui ne peut donner lieu à un connecteur 
propositionnel. En effet, étant donné quatre propositions, 
toutes supposées vraies : « X est mort », « X a mangé un 
mets empoisonné », « II neige », « C’est l'été », par combi- 
naison des deux premières on obtient une proposition 
vraie : « X est mort parce qu'il a mangé un mets empoi- 
sonné », tandis que la combinaison des deux dernières 
donne une proposition fausse : « Il neige parce que c'est 
l'été ». 
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On dénombre habituellement cinq connecteurs exten- 
sionnels : un connecteur unaire se rapportant à une pro- 
position unique, la négation, notée —, et quatre connec- 
teurs binaires reliant entre elles deux propositions, la 
conjonction, la disjonction, le connecteur « si... alors » et le 
« si et seulement si », notés respectivement À, V,=,<. 
Ce ne sont pas les seuls possibles mais les plus courants. 

On définit chacun de ces connecteurs en indiquant la 
valeur de vérité prise par le composé le plus simple auquel 
il donne lieu, en fonction des diverses combinaisons 
possibles de valeurs de vérité (vrai et faux) attribuées 
aux propositions atomiques composantes. Ainsi la néga- 
tion d'une proposition est vraie exactement quand cette 
proposition est fausse; la conjonction de deux proposi- 
tions n'est vraie que dans le seul cas où les deux propo- 
sitions sont vraies, elle est fausse si l’une des deux ou les 
deux sont fausses; la disjonction de deux propositions 
n'est fausse que dans le seul cas où les deux propositions 
sont fausses, elle est vraie si l’une des deux (ou les deux) 
est vraie; l'implication dite matérielle, c'est-à-dire le 
connecteur désigné ci-dessus par « si. alors », n'est 
fausse que si la proposition antécédente est vraie et la 
conséquente est fausse ; elle est vraie si l’antécédent et le 
conséquent sont vrais, si l'antécédent et le conséquent 
sont faux, et si l'antécédent est faux et le conséquent 
vrai; « si et seulement si » est vrai si les deux propositions 
sont simultanément vraies ou simultanément fausses, 
il est faux si l'une des deux est vraie tandis que l'autre 
est fausse. 

On notera en passant que le V du calcul propositionnel 
correspond à la disjonction inclusive de la langue usuelle, 
et que l'implication matérielle est définie en désaccord 
total avec l'usage intuitif usuel de l'expression « implique » 
qui désigne généralement une sorte de connexion 
nécessaire entre deux phénomènes. Une proposition 
comme « si 2 + 2 — 5, alors la Seine traverse Paris » 
est une proposition vraie du point de vue du calcul 
propositionnel, tandis qu'elle n’a pas de sens dans la 
langue usuelle, vu qu'il ny a aucun rapport entre l'anté- 
cédent et le conséquent. 

De manière plus formelle, le langage du calcul des pro- 
positions P est constitué d'abord d'un certain nombre de 
symboles primitifs, c'est-à-dire non définis, qui sont: 

— les /ettres de proposition : p, q, r, etc., en nombre 
infini, qui représentent les propositions atomiques; 

— les symboles de connecteurs : —1, À, V,—, «. 
Cette liste est redondante, car pour définir P, il suffit de — 
et de l'un seulement des quatre connecteurs binaires cités 
les trois autres pouvant s'exprimer en fonction de celui-ci 
et de la négation. Nous choisirons ici le couple de connec- 
teurs (—, À ). Dans certains cas, un seul connecteur suffit 
pour définir P; cela arrive lorsque ce connecteur inclut 
en lui-même l'idée d'une négation, par exemple la barre 
de Scheffer, notée p/a, qui est équivalente à— p V — g: 

— les symboles de parenthèses : (, ). 

Toute suite finie de symboles pris parmi les précédents 
est un mot; parmi les mots on distingue ceux qu'on 
appelle les expressions bien formées ou formules du 
calcul des propositions, définies inductivement par 
les règles suivantes : 

— toute lettre de proposition isolée est une formule; 

— si À est une formule, (— A) est une formule; 

— si À et B sont des formules, (A A B) est une 
formule ; 

— un mot est une formule seulement s'il est obtenu 
par un nombre fini d'applications des trois règles pré- 
cédentes. 

On peut également donner une définition récursive de 
la notion de formule, fondée sur la longueur des suites 
finies de symboles du vocabulaire initial : un symbole 
isolé est une formule si et seulement si c'est une lettre de 
proposition. 

Une suite finie À de symboles de longueur n > 1 
est une formule si et seulement s'il existe des formules 
B et C de longueur inférieure à n telles que A est soit (— 
B) soit (B A C). 

En termes ensemblistes, on peut encore dire (d'une 
troisième facon) que l'ensemble des formules F est le 
plus petit sous-ensemble de P contenant les lettres de 
proposition et tel que s'il contient les formules A et B, 
il contienne aussi (— A) et (A À B). 

Étant donné cette définition inductive de l'ensemble 
des formules, l'appartenance d'une propriété à toutes les 
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formules ne pourra être établie que par induction; pour 
une propriété © on établira : 

— que toute lettre de proposition a la propriété o; 

— que si la formule A est de la forme (— B) et que 
B ait la propriété ©, alors A a la propriété o; 

— que si À est de la forme (B À C) et que B et C 
aient la propriété o, alors À a la propriété ©. 


Sémantique formelle de P 

Rappelons que nous nous placons dans le cadre d'une 
logique bivalente, c'est-à-dire précisément où il y a deux 
valeurs de vérité : le vrai, représenté par le symbole 1, et 
le faux représenté par 0. Une lettre de proposition peut 
avoir une de ces deux valeurs. 

Soit À une formule contenant n lettres de proposition, 
disons : p1, p2, …, Dn. AssSigner une valeur de vérité déter- 
minée à chacune des lettres de proposition p;, c'est définir 
une fonction à définie sur l'ensemble {p1, p2, …, Dn} et 
à valeurs dans {0, 1}. La valeur de vérité de A est relative 
à une telle assignation, appelée souvent encore distri- 
bution de valeurs de vérité sur les lettres de proposition 
apparaissant dans A. Plus généralement on parlera de 
distribution de valeurs sur les lettres de proposition du 
langage P et on définira récursivement la notion de valeur 
de A pour une distribution donnée 3 : 

— si À se réduit à une lettre de proposition, sa 
valeur de vérité est déjà connue; 

— si À est de la forme — B, la valeur de vérité de 
A est l'opposée de celle de B (0 si B a la valeur 1, 1 si 
B a la valeur O); 

— si À est de la forme (B A C), sa valeur est 1 si 
B et C ont toutes deux la valeur 1 ; sinon c'est 0. 

Une formule A est dite tautologie si elle a la valeur 1 
pour toute distribution de valeurs de vérité sur les lettres 
de proposition qu'elle contient : ce qu'on note H- A. 

La valeur d'une formule A pour une distribution donnée 
se calcule facilement de proche en proche : partant de la 
valeur assignée aux lettres de proposition, on calcule pro- 
gressivement la valeur des sous-formules de À, de la plus 
simple à la plus complexe, pour arriver enfin à A. On 
peut réunir sous forme de tableau les résultats indiquant 
la valeur de vérité de À pour toutes les distributions de 
valeurs possibles sur les lettres de proposition qu'elle 
contient; pour n lettres on a 27 possibilités (il faut se 
souvenir ici qu'on a défini une distribution de valeurs de 
vérité sur n lettres comme une fonction : 


{0, 1, 2, …, n} > {0, 1}, 


et connaître par ailleurs le résultat élémentaire de la théo- 
rie des ensembles selon lequel l'ensemble de telles fonc- 
tions est de cardinal 27). Ce tableau s'appelle la table 
de vérité de A. 

Par exemple, prenons pour A la formule : 


pA(—gA— (pAr)). 


Richard Colin 


Ce procédé simple (devenu courant en logique essen- 
tiellement depuis les travaux de Post en 1921), quoique 
parfois assez long, fournit un moyen mécanique et fini 
pour déterminer si une formule est une tautologie : on 
écrit sa table de vérité et on vérifie si on trouve la valeur 1 
à toutes les lignes de la table. Notons en passant qu'une 


formule qui n'est pas une tautologie peut être soit une 
formule neutre, vraie pour certaines distributions de valeurs 
sur ses lettres de proposition, fausse pour d'autres, ainsi 
que c'est le cas de notre formule A précédente, soit une 
antilogie (ou contradiction) si elle est fausse pour toute 
distribution de valeurs. Notons surtout que ce procédé 
fournit une définition formelle très commode des connec- 
teurs propositionnels que nous avons présentés de façon 
intuitive plus haut : 


Richard Colin 


Nous venons de dégager la notion cardinale de tauto- 
logie; soulignons qu'il s'agit là d'une notion syntaxique, 
en ce sens qu'elle ne fait pas appel aux modèles. D'un 
point de vue sémantique on peut définir formellement 
(par induction encore une fois) l'expression « A est vraie 
dans un modèle AC », en entendant par modèle sim- 
plement un sous-ensemble de P: on notera {AC |— A. 
Une formule A sera alors valide si elle est vraie dans tous 
les modèles de P. 

Le premier théorème de complétude établit l'équi- 
valence logique des concepts de validité et de tautologie et 
autorise par conséquent l’utilisation des tables de vérité 
pour déterminer si une formule est ou non valide. Ce pre- 
mier théorème sera suivi d’un autre du même nom mais 
de plus large portée. Symboliquement + A si et seule- 
ment si |— A; on remarquera que le signe + s'emploie 
dans un contexte syntaxique et le signe | dans un 
contexte sémantique. Ce premier théorème établit en fait 
leur équivalence. 


Définition du concept de déduction formelle 

Il faut introduire d'abord dans notre langage P la 
règle d'’inférence connue sous le nom de modus ponens 
qui établit que de « À » et « À > B » on peut conclure 
à «B ». Puis on dira que À est déductible d'un ensemble de 
formules ©, symboliquement : Z + A, si et seulement 
s'il existe une suite finie Bo, B1, … Br de formules telle 
que A soit précisément B: et que toute formule B; soit, 
ou bien un élément de l’ensemble X, où bien une tauto- 
logie, ou bien obtenue par application du modus ponens 
à deux formules antérieures dans la suite. La suite 
Bo, B1, …, Bn constitue une déduction de A à partir de Y. 
Notons que A est déductible de l'ensemble vide si et seule- 
ment si c'est une tautologie. La propriété la plus importante 
de la déduction est énoncée par le théorème de la 
déduction : 
siBo, B1, B2, …, Bn + À alors Bo, B1, Bo, …, Bn-1 + Bn — A. 


Le théorème de complétude élargi 

Un ensemble Z de formules est dit inconsistant si et 
seulement si Y |- À pour toute formule À. 

Par ailleurs nous avons déjà vu que AC est un modèle 
de Z si et seulement si toute formule de Y est vraie dans A. 
Z est dit satisfaisable si et seulement s'il a au moins un 
modèle. Le théorème suivant, le plus important du calcul 
des propositions, donne un critère pour déterminer quand 
un ensemble de formules est satisfaisable : Z est consis- 
tant si et seulement s'il est satisfaisable. Comme le 
précédent ce théorème jette un pont entre le point de vue 
syntaxique et le point de vue sémantique. 

Un corollaire de nature purement sémantique est connu 
sous le nom de théorème de compacité : Z est satis- 
faisable si tout sous-ensemble fini de È est satisfaisable. 

Le théorème de compacité a de nombreuses applications 
dont nous ne pouvons parler ici. 


Le calcul des prédicats du premier ordre 


Une phrase comme « tous les nombres sont plus grands 
que 1 » constitue dans le calcul propositionnel une propo- 
sition atomique qu'on ne cherche pas à analyser plus 


précisément. Nous allons maintenant présenter un langage 
plus riche où cette analyse sera possible; le calcul des 
prédicats étudie, en effet, les expressions du type : «tous », 
«il y a », « quelques », etc., et ce qu'on appelle prédicats, 
ou mieux et pour les désigner par leur nom mathématique 
usuel aujourd'hui, les relations mettant en jeu un ou 
plusieurs individus, comme : « est rouge », « plus grand 
que », « appartient à », ou même « est » qui s'emploie en 
des sens bien différents. Les noms des individus entrant 
dans la relation considérée sont désignés comme des 
constantes d'individu ; le nombre des individus auxquels 
s'applique la relation s'appelle le nombre de places de 
la relation ou du prédicat. 

Par exemple « est un homme » dans « Socrate est un 
homme » est un prédicat à une place; « plus grand que » 
est un prédicat à deux places; « sept est la somme de 
trois et quatre » nous donne l'exemple d’un prédicat à 
trois places. Plus généralement on parlera de relations à 
n places où n est un nombre entier positif. 

Formellement les prédicats seront notés par des majus- 
cules latines P, Q, … et P (x) signifiera : « x a la pro- 
priété P ». L'expression « pour tout... » est appelée quanti- 
ficateur universel, notée V; «il y a », «il existe », « quel- 
ques » sont synonymes et s'appellent quantificateur 
existentiel, noté 3. « Tout x a la propriété P » sera donc 
noté : Vx P (x); «il existe un x ayant la propriété P » 
sera noté : 2x P (x). On sait que 2x P (x) est logiquement 
équivalent à — Yx — P (x), en sorte qu'on peut se 
limiter, pour définir formellement L, au seul symbole du 
quantificateur universel. 

Dans les expressions « Vx P (x) » et « 2x P (x) », 
x s'appelle une variable liée où muette; ce qui signifie 
que le sens de l'expression n'est pas changé si on substitue 
partout à x, y ou toute autre minuscule latine. « Vx P (x) » 
a la même signification que « Vy P (y) ». 


Définition formelle du langage L 

Le langage L est déterminé par deux groupes de sym- 
boles : les symboles de relation et les symboles de cons- 
tantes d'individus. Pour compléter la liste des symboles 
primitifs, il faut ajouter : 

— les symboles : 
d'individus ; 

— les connecteurs propositionnels, disons — et A ; 

— le quantificateur universel VY ; 

— les parenthèses gauche et droite (, ). 

Toute suite finie de symboles pris dans cette liste 
est un mot de L, et on définit l'ensemble des formules 
ou expressions bien formées par induction, d'une manière 
analogue à celle déjà employée pour le calcul proposition- 
nel: 

(1) les formules atomiques sont de la forme 
P (x1, X2, …, Xn) cù P est un prédicat à n places et les x; 
des variables d'individus ; 

(2) si A et B sont des formules, (— A) et (A A B) 
sont des formules; 

(3) si x est une variable d'individu et À une formule, 
Yx A est une formule ; 

(4) une suite de symboles n'est une formule que si 
elle est obtenue par un nombre fini d'applications des 
règles (1), (2) et (3). 


Xo, X1, X2, …, appelés variables 


Variables libres et variables liées 

Supposons que VxB est une sous-formule d'une for- 
mule A; B est appelée la portée du quantificateur uni- 
versel Yx. Toute occurrence de x dans VxB est une 
occurrence liée de x dans A. Une occurrence non liée 
de x dans A est une occurrence libre. 

Soit, par exemple, dans la formule : 


P (x y) = Vx (VyR (x y) = Q (x y)) 


La première occurrence de x est libre, les trois autres 
occurrences de x sont liées, les première et dernière 
occurrences de y sont libres, la seconde et la troisième 
sont liées; la formule Vy R (x, y) — Q (x, y) constitue 
la portée du quantificateur universel Vx, et R (x, y) celle 
du quantificateur universel Vy. 

Une variable est libre dans une formule A si elle y a 
au moins une occurrence libre dans A. Une formule est 
close si aucune des variables qu'elle contient n'y est 
libre. Une formule close est une proposition en ce sens 
qu'elle est soit vraie, soit fausse, tandis qu'à une formule 
non close où ouverte, appelée forme propositionnelle, on 
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ne peut associer de valeur de vérité déterminée. Par exem- 
ple, dans l'arithmétique usuelle, la forme proposition- 
nelle « x < 5 » est vraie pour certains entiers, fausse pour 
d'autres: la proposition « Vx (x < 5) » est fausse et 
la proposition « 2x (x < 5) » est vraie. On aura remarqué 
au passage qu'il suffit de quantifier la variable libre 
x dans « x < 5 » pour transformer la forme proposition- 
nelle en proposition, « x < 5 » étant vraie pour certains 
entiers, on dira qu'elle est réalisable où satisfaisable dans 
N. Mais elle n'est pas valide dans N puisqu'elle n'est 
pas vraie pour tous les éléments de N. 

Si x est une variable d'individu et z une variable ou une 
constante d'individu, si À est une formule quelconque, 
S£ A désigne la formule obtenue en substituant z à toutes 
les occurrences libres de x dans A. 


Modèles 

Soit X un ensemble et # un entier positif. Un £-tuple 
d'éléments de X est une suite ordonnée d'éléments de X; 
l'ensemble de tous les k-tuples de X est noté XX. Un pré- 
dicat P à k-places sur X est un ensemble de k-tuples 
formés d'éléments de X, c'est-à-dire un sous-ensemble de 
X£Æ; on dit que les éléments de ce sous-ensemble satis- 
font P. Par exemple, si X est l'ensemble des entiers natu- 
rels, l'ensemble : {(x, y) € X2; x < y} est une relation 
binaire (à 2 places) satisfaite par le couple (3,4) mais non 
par le couple (4,3). 

Un monde possible ou modèle AC du langage L se 
constitue d'une part d’un ensemble X, ou univers, non 
vide: d'autre part d'une fonction J qui interprète toute 
lettre de prédicat à k-places comme une relation à 
k-places sur X, et toute constante d'individu comme un 
élément de X; AC — (X, J). On remarquera que la situation 
est beaucoup plus compliquée qu'en calcul des proposi- 
tions, car ici les propositions ou formules closes énoncent 
quelque chose sur les individus du modèle considéré ; 
il n'est plus aussi aisé de décider si une proposition de 
langage L est vraie ou fausse dans tel modèle, alors qu'on 
disposait d'un moyen de résoudre la même question pour 
toute proposition du langage P et pour tout modèle de P. 

Plus précisément considérons une proposition À de L 
et cherchons si A est vraie dans le modèle JC ; si A est de 
la forme — B où encore de la forme B A C, il est clair 
que nous saurons répondre à la question si nous savons 
si B et C sont vraies dans AC; mais si À est de la forme 
Yx B, il se peut que x soit libre dans B et par conséquent B 
n'est plus une formule close alors que A l'était. Dans ce 
dernier cas cela n’a pas de sens de demander si B est 
vraie dans AC; tout ce que nous pouvons demander, c'est 
si pour chaque élément a en particulier de l'ensemble X 
constituant le domaine de base de A, B est vraie ou non. 
Mais supposons que B soit elle-même de la forme VyC, 
on retrouve la même difficulté : on ne pourra poser la 
question de la vérité de C que pour un couple d'éléments a, 
b de X. Plus généralement, si on convient de noter 
A (Xxo, X1, …, Xn) une formule A de L où les variables libres 
de A forment un sous-ensemble de {xo, x1, …, Xn}, on 
demandera si À est vraie lorsqu'on prend le n-uplet 
(ao, 41, .…, an) d'éléments de X pour les variables 

X0, XL, +. Xn: 

Nous ne pouvons développer ici les moyens qui per- 
mettent de résoudre proprement cette difficulté; ceux-ci 
conduiraient évidemment à une définition par induction 
de la relation AC [+ A, qui signifie que la proposition A 
est vraie dans AC ou que AC satisfait A ou encore que A 
est un modèle de A. Mais pour permettre une comparaison 
avec ce qui se passe dans le calcul propositionnel, nous 
pouvons présenter cette définition par récurrence dans 
une situation simplifiée : on considérera qu'une formule 
atomique est de la forme P (a1, 42, …, 41) où P est une 
lettre de prédicat et les a; des constantes, éléments de X. 
Dans ce cas: 

1) AGE P (a1,a2,.., an) si (a, 42, 
fait l'interprétation (P) de P dans AC; 

2) AC —- B si et seulement si non AB; 

3) AC B À C si et seulement si AB et 
AC = C; 

4) AC = Vx A si et seulement si pour tout 2€ X, 


., an) Satis- 


Par exemple, si X est l'ensemble des nombres naturels et 
P la relation <, on a AC = Vx (P (6, x) > P (3, x)), 
mais non AC Vx (P (3, x) + P (6, x)). On dira que À 
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est universellement valide si.AC [— A pour tout modèle AC 
de L. 

Maintenant, dans le cas où A n'est pas une proposition 
ou formule close, c'est-à-dire, avec la convention adoptée 
plus haut si À est de la forme A (x1, X2, …, Xn), on dira 
qu'elle est universellement valide si et seulement si sa 
clôture universelle Vx1 Vx2 … Vxn À (x1, X2, …, Xn) est 
valide. 

Étant donné un ensemble Y de propositions, AC est 
un modèle de *, si et seulement si AC est un modèle pour 
toute proposition appartenant à XZ. Une proposition ou 
un ensemble de propositions est satisfaisable (ou réali- 
sable) si et seulement s'il a au moins un modèle. 

Une proposition À est conséquence d’une proposition B 
si et seulement si tout modèle de B est aussi un modèle 
de A. 

Il reste à définir la notion de déduction formelle avant 
de citer les théorèmes importants du calcul des prédicats : 
le théorème de complétude et le théorème de compacité. 
La situation est tout à fait analogue à celle qu'offrait le 
calcul des propositions. Considéré comme système for- 
mel, L se compose d'un certain nombre d'axiomes et 
de règles d'inférence. 

Les axiomes sont de deux types : 

— les axiomes propositionnels, toute tautologie T 
de calcul des propositions peut donner lieu à un axiome 
de L quand on substitue convenablement aux lettres de 
propositions contenues dans T des formules de L'; 

— les axiomes concernant l'usage des quantifi- 
cateurs; par exemple si À et B sont des formules de L 
et x une variable non libre dans À, alors la formule 
Vx (A = B) = (A — Vx B) est un axiome logique. 

Quant aux règles d'inférence, on en admet deux: 

— le modus ponens déjà utilisé en calcul des pro- 
positions ; 

— la règle de généralisation propre où calcul des 
prédicats : de À on peut inférer Vx A. 

Moyennant ces données, la notion de déduction estabso- 
lument la même qu'en calcul des propositions : ajoutons 
simplement qu'on appelle théorème une proposition qui 
se déduit des axiomes donnés, à l’aide des règles d'infé- 
rence admises. « À est un théorème » s'écrit : si Z est un 
ensemble de propositions, Z + A signifie qu'il existe une 
déduction (ou preuve) de A à partir des axiomes et de X. 
On écrit en général simplement Ÿ H A, étant naturel- 
lement sous-entendu que les axiomes font également 
partie des hypothèses. Y est dit /nconsistant si toute for- 
mule de L se déduit de Y et consistant dans le cas contraire. 
On peut énoncer alors: 

— Le théorème de complétude de Gôüdel : 
toute proposition À est un théorème de L si et seulement 
si À est (universellement) valide. C'est-à-dire + A 


si F À. D'où l'équivalence logique de la notion syn- 
taxique de déduction et de la notion sémantique de 
conséquence. 


— Le théorème de complétude élargi : soit E un 
ensemble de propositions ; E est consistant si et seulement 
s'il a un modèle. 

— Le théorème de compacité : un ensemble de 
propositions Ÿ a un modèle si et seulement si tout sous- 
ensemble fini de © a un modèle. 


Conclusion 


Ce sont là quelques-uns des concepts fondamentaux de 
la logique mathématique qui connaît encore actuellement 
un développement des plus intenses. Elle n'a pas seule- 
ment réalisé tous les programmes logiques anciens en 
leur donnant l'exactitude et la concision voulues, en écar- 
tant des disciplines rigoureuses ambiguïtés et malentendus 
issus d'une maîtrise insuffisante des moyens d'expression, 
en précisant l’idée de fondement des mathématiques non 
seulement par l'élaboration explicite des principes utilisés 
le plus souvent implicitement, mais encore des concepts 
de déduction et de démonstration; bref, en réalisant cette 
idée surgie peu à peu dans les mathématiques modernes, 
qu'il ne suffit pas d’accumuler des résultats, qu'il est 
indispensable pour une science rigoureuse de savoir où 
elle va et comment elle y va. Il n'est donc pas étonnant 
que les résultats les plus impressionnants de la logique 
mathématique soient des résultats négatifs : ils nous disent 
ce qu'il est vain de chercher et nous orientent sur ce qu'il 
est toujours possible, pour ainsi dire, a priori, de trouver. 


Univac 


INITIATION A L'INFORMATIQUE 


Généralités 


L'informatique, considérée comme science du traite- 
ment rationnel de l'information, support des connaissances 
et des communications, n'est pas une discipline très 
récente. Cependant, les progrès technologiques ayant 
permis la réalisation de machines de plus en plus 
complexes, l'informatique prend une importance crois- 
sante dans presque tous les secteurs d'activité, par la 
généralisation de l'emploi des ordinateurs, instruments à 
la fois de travail et de recherche. 

La machine de Pascal constitue en quelque sorte le 
point de départ du développement des machines à cal- 
culer. Il s’agit d'une machine à roues dentées fonction- 
nant suivant le principe encore utilisé aujourd'hui des 
compteurs totalisateurs mécaniques. Chaque roue com- 
porte dix positions, portant les chiffres de O à 9. Lors du 
passage de 9 à O, la roue fait avancer d'une position la 
roue suivante. L'opération de base, sur une telle machine, 
est l'addition. On peut également réaliser des multipli- 
cations par additions successives portant sur les puissances 
de 10 successives. 

Le développement de cette technique a abouti aux 
machines à calculer mécaniques effectuant les quatre 
opérations (et quelquefois des opérations plus complexes, 
comme l'extraction de racines carrées) et imprimant les 
résultats. Si les performances de telles machines repré- 
sentent un grand pas en avant par rapport à la machine de 
Pascal, les principes de base et le mode d'emploi n'en 
sont pas moins les mêmes. li faut introduire manuellement 
les données, et actionner les touches d'opérations dans 
l'ordre voulu pour obtenir le résultat. De plus, il est sou- 
vent nécessaire de noter des résultats intermédiaires, soit 
pour les réintroduire dans une phase ultérieure du calcul, 
soit pour prendre des décisions sur la façon de mener la 
suite du calcul. 

Pour automatiser ces opérations il faut donc que le 
calculateur puisse stocker des résultats intermédiaires, et 


soit capable d’enchaîner les opérations et, éventuellement, 
de modifier l'enchaînement en fonction de certains résul- 
tats. 

Par exemple, si on cherche les solutions réelles d'une 
équation du second degré, 


ax? bx+c—0 


on calcule d’abord : À — b?— 4 ac; 

ensuite, si À < O, il faut arrêter le calcul, car dans ce 
cas l'équation n'a pas de solution réelle; 

si À > O, on peut calculer les solutions : 


se b— JA — b + JA 
1= — ; — 
b a 2a 

Bien entendu, il est cependant nécessaire d'introduire 
les données ainsi que la suite d'opérations à effectuer et 
les conditions dans lesquelles les effectuer. 

C'est à peu près ce que réalisaient les machines mécano- 
graphiques, associées à un bloc de calcul. Ces machines 
étaient munies d’un bloc de commande câblé et pouvaient 


X2 = 
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À L'informatique 

prend une importance 
croissante par 

la généralisation de l'emploi 
des ordinateurs, 
instruments à la fois 

de travail et de recherche. 


Y La « machine 
arithmétique » de Pascal 
(Paris, musée des Arts 
et Métiers). 


Figure 1 : 

un exemple de 

deux représentations 
différentes d'une même 
chose sur le même 
support physique. 


effectuer des calculs et des opérations tels que des tris, 
en utilisant des cartes perforées comme support de l'in- 
formation. 

Par ailleurs, le mathématicien anglais Babbage avait, 
au milieu du XIX® siècle, conçu un type de machine 
capable de recevoir les données d’un problème et la suite 
d'opérations à effectuer pour arriver au résultat souhaité 
(Analytical Engine). Certains principes se retrouvent dans 
les calculateurs actuels, mais la technologie entièrement 
mécanique de l'époque et la complexité de la machine 
n'en ont jamais permis la réalisation complète. 

Deux éléments importants ont permis l’évolution vers les 
machines actuelles. 

Le premier est technologique : le développement de 
l'électronique a permis la réalisation de machines de plus 
en plus performantes en capacité, en rapidité et en 
complexité. 

Le deuxième est théorique : c'est l'introduction par 
Goldstine et von Neumann, en 1947, de la notion de 
programme enregistré. 

L'idée consiste à stocker ensemble le programme et les 
données dans la mémoire de la machine, sans faire 
a priori de distinction sur leur nature. La distinction se fait 
par la facon logique de les structurer, non par la façon 
physique de les introduire dans la machine. 

Avec l'apparition de la notion de programme enregistré, 
la structure générale des machines s’est à peu près fixée. 
La technologie et les méthodes d'utilisation des calcula- 
teurs, en particulier les moyens de communication avec 
la machine, continuent d'évoluer grâce aux progrès 
techniques d’une part, aux travaux théoriques d'autre part. 


Représentation de l'information 


Pour pouvoir traiter une information, il est nécessaire 
que cette information soit sous une forme accessible 
à l'organe de traitement, c'est-à-dire que cet organe 
puisse « comprendre » l'information. Cela suppose deux 
choses : 

— un support physique de l'information; 
— un mode de représentation (« support logique ») 
sur le support physique. 

Voici deux représentations différentes d'une même 
chose sur le même support physique (fig. 1) : 


Dans les deux cas, le support physique est constitué 
de traits d'encre sur du papier. Dans le premier cas le 
mode de représentation est graphique, figuratif; dans le 
deuxième cas, c'est une représentation à l'aide d'un mot 
de la langue française. 

On peut de la même façon, prendre le mot TABLE et le 
faire supporter par des supports physiques différents, par 
exemple : 

— comme précédemment, on peut l'écrire; 

— on peut le prononcer et l'enregistrer à l'aide d'un 
magnétophone. Dans ce cas, le support physique de 
l'information est la bande magnétique. 

Dans ce qui suit, nous allons essentiellement traiter 
des modes de représentation de l'information plutôt 
que des supports physiques. 
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Représentation des nombres 

Les nombres sont représentés à l'aide de symboles 
appelés chiffres. Il existe plusieurs modes de représenta- 
tion, ou systèmes de numération. 

e Les systèmes non pondérés : chaque symbole a 
une valeur intrinsèque, ne dépendant pas de l’emplace- 
ment du symbole dans la représentation. C'est le cas de la 
numération romaine. 

e Les systèmes de position : une pondération est 
introduite par la position du symbole. Une catégorie 
importante est constituée par les systèmes à base cons- 
tante. Dans un système à base b (b est un nombre entier), 
on représente les nombres à l'aide de b symboles : 
So, Si, …, Sy -1 représentant les valeurs entières de 0 
à b—1. Ainsi, dans le système décimal (b — 10) on 
utilise les chiffres 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. On représente 
les nombres avec ces symboles et éventuellement un 
point pour séparer la partie entière de la partie fraction- 
naire (l'usage en informatique est d'utiliser le point et 
non la virgule, conformément à l'écriture anglo-saxonne 
des nombres; compte tenu de l'importance croissante 
de l'usage des ordinateurs, et pour éviter des notations 
multiples pouvant créer des confusions, l'utilisation du 
point tend à se généraliser dans les autres disciplines). 

La représentation suivante : 


An An—1 .… 81 40 + 8/1 42. ap (D) 
désigne le nombre : 


N = an bn + an-1 b7-1 +... a1 b + 
80 — 8171 + 82 b72+ .. + a» bp? () 


Tousles a, a’ étant des symboles pris parmi So, S1, …, Sp -1. 

Pour simplifier les notations, nous avons confondu les 
symboles et les valeurs qu'ils représentent. (1) est une 
représentation symbolique, alors que (II) est une expres- 
sion arithmétique. Nous verrons qu'il convient d'être 
prudent lorsqu'on fait ce genre de confusion (voir Adresse 
symbolique). 


Passage dans une base donnée 


Considérons le nombre précédent; nous allons traiter 
séparément la partie entière, notée E(N) et la partie frac- 
tionnaire F(N). 

Posons N1 = E(N),ona: 


N1 = àn D? + an-1 b% 1 DL... L a1 b + &o. 
On peut mettre b en facteur dans les n premiers termes : 


Ni = D (an bn-1+ an 1 br? +. 
(avec &o < b) 


+ 41) + &o. 


Sous cette forme, on voit que ao est le reste de la division 
entière de N1 par b, le quotient étant : 


No = an bn-1 2 gp_1 br? — ,., — ax. 


De même, a1 est le reste de la division entière de N2 par b. 
En recommencant l'opération jusqu'à l'obtention d'un 
quotient nul, on obtient successivement les valeurs cor- 
respondant aux chiffres de la représentation de N dans le 
système à base b. 
Exemple 
Trouver la représentation en système octal (base 8) 
du nombre décimal 253 
258 :8 = 31 
31:8—=3 reste 
3:8—0 reste 3 
La représentation octale est donc 375. 
Posons maintenant M = F (N), on a M1 < 1: 


M1 = 41h71 a2b-2—+.. + a, b?; 
calculons b x M1: 
b X M1 = a” + 82 b-1 +... — 2'p b-D:+1 


on voit que a”: est la partie entière de b x Mi. 

Posons M2 = F (b X Mi) = a’2 b71 + … 
de même a’2 est la partie entière de b X M. 

En continuant l'opération, on obtient les différents 
chiffres de la représentation de M: dans le système à 
base b. Il faut remarquer que cette représentation n'est 
pas toujours finie. Dans la démonstration précédente, 
nous avions supposé a priori une représentation finie. 
De plus une partie fractionnaire à représentation finie 
dans une base peut avoir une représentation infinie dans 
une autre. 


reste 5 


ap brP+1: 


Exemple 


è 1 g :  . 
La fraction Frs est représentée en décimal par 


= 0.3333... avec une infinité de 3 et par F = 0.1 en 
système à base 3. 
Autre exemple 

Trouver la représentation en système à base 5 du nombre 
décimal 0.6. 


0.5 x 5 = 2.5 2 partie entière, .5 partie fractionnaire 
0.5 x 5 = 2.5, etc. 


La représentation cherchée est donc 0.2222... 

Nous venons de voir deux algorithmes (algorithme : 
suite d'opérations à effectuer) permettant de convertir, 
d'un système de numération à un autre, les parties entières 
et fractionnaires d’un nombre. Remarquons que dans les 
exemples donnés, il s'agissait de passer du système déci- 
mal à un autre système; les calculs étaient effectués en 
décimal, c'est-à-dire dans le système de départ. On peut 
également faire la conversion en effectuant les calculs dans 
le système d'arrivée. Il suffit alors, dans ce système, de 
calculer l'expression (II) où les a et a’ désignent les 
chiffres de la représentation de départ et b la base de 
départ. Reprenons un exemple précédent à l'envers : 


convertir N — 375 (OCTAL) en décimal, 
N=3x8 + 7x8 + 5— 253 (DÉCIMAL) 


Les systèmes habituellement utilisés en informa- 
tique (voir tableau |) sont les suivants. 

— Système décimal : utilisé essentiellement dans les 
opérations d'entrée de données ou de sortie de résultats 
car c'est le système auquel tout le monde est habitué. 

— Système binaire : c'est dans ce système que 
travaillent les calculateurs électroniques. 

— Système octal. 

— Système hexadécimal : système à base 16. On 
utilise les lettres À, B, C, D, E, F, comme chiffres repré- 
sentant les valeurs 10, 11, 12, 13, 14, 16. 

L'intérêt des systèmes octal et hexadécimal est que la 
conversion du binaire dans l’un de ces systèmes et l'inverse 
sont immédiats. Cette propriété est d’ailleurs vraie quand 
deux systèmes sont tels que la base de l'un est une puis- 
sance entière de la base de l'autre. 

En effet, reprenons l'expression : 


Ni = An D? + an-1 br +. + 


ap D? + ap -1 bP-1+ + ab + & 
et divisons par b? (division entière) : 
N1:0? = an bn-D + an-1 bt-1-P +... + a; 
reste — 4p-1 bP-1+ a,_9 bP-? +... + 41 b + & 


Les p derniers chiffres de Ni: 49 8p -1 … a 40 représen- 
tent donc dans le système de base b la valeur du dernier 
chiffre dans le système de base b?. Donc, pour passer 
du système à base b au système à base b?, on groupe les 
chiffres par groupes de p en commencant par le chiffre 
des unités, et on remplace chaque groupe par le chiffre 
ayant même valeur dans le système de base b?. 

Le passage inverse se fait en remplaçant chaque chiffre 
par sa valeur exprimée sur p chiffres dans la base b. 
Exemples 

Passer de la représentation binaire 10110100 à la repré- 
sentation octale : 10110100 — 264 (OCTAL). 

Passer de la représentation hexadécimale A74 en 
binaire : 

A—>1010, 70111, 4—0100 soit 101001110100. 

L'octal et l’hexadécimal constituent des notations 
abrégées plus faciles à utiliser que le binaire, en en étant 
cependant très proches. 

— Système décimal codé binaire (DCB) : il s'agit 
d'une représentation mixte. Le système de numéra- 
tion est décimal mais au lieu d'utiliser les chiffres déci- 
maux, on les remplace par le nombre binaire exprimé sur 
quatre bits (bit : chiffre binaire, abréviation de l'anglais, 
Binary Digit). 

Exemple : 48 en décimal; 

4 s'écrit 0100, 8 s'écrit 1000, 48 s'écrit 01001000. 

— Codes binaires pondérés : en général, ils sont des- 
tinés à coder les chiffres décimaux. Ils s'expriment au 
moyen de 4 bits, chacun ayant un poids correspondant à 
sa position. 
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Exemple : le code 2421. Dans ce code 1110 représente 
2+4+2 — 8. | faut pouvoir coder tous les nombres 
de 0 à 9 avec les poids disponibles (ainsi, 6211 ne per- 
met pas de coder 5). Remarquons que le code DCB est 
un code pondéré particulier : code 8421. 


Les codes redondants 

Les parasites électriques peuvent affecter les transmis- 
sions entre organes de traitement et faire qu'un bit soit 
mal détecté (0 au lieu de 1, ou inversement). Dans ce cas, 
il existe des méthodes permettant de détecter et éven- 
tuellement de corriger les erreurs. Elles consistent à 
ajouter des bits supplémentaires, qui ne sont pas signi- 
ficatifs du point de vue de l'information considérée (ces 
bits sont dits « redondants »), mais permettent de vérifier 
s'il y a eu erreur ou non. 

— Codes à parité fixe 

On ajoute un bit, appelé bit de parité, tel que le nombre 
total de bits égaux à 1 soit pair (respectivement impair), 
si on a choisi de travailler en parité paire (respectivement 
impaire). Si une erreur de transmission s'est produite, 
portant sur un bit, un contrôle de parité nous avertit 
de l'erreur, car la parité a été changée. 

Exemple 

En DCB, 8 et 9 s’écrivent respectivement 1000 et 1001. 
Ajoutons un bit de parité impaire en dernière position. On 
obtient respectivement 10000 et 10011. Si en cours d'opé- 
ration, on trouve un code tel que 10001, on sait qu'il y a 
erreur, car ce code n'a pas de parité impaire. Bien entendu, 
un tel procédé ne permet que de détecter une erreur et 
non de la corriger. Il ne permet pas non plus de détecter 
deux erreurs simultanées, car, dans ce cas, la parité reste 
inchangée. 
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1 
2 
3 
4 
5 
6 
7 

8 
9 
A 
B 
c 
D 
E 
F 

10 
11 


0001 
0010 
0011 
0100 
0101 
0110 
o111 
1000 
1001 
0001 0000 
0001 0001 
0001 0010 
0001 0011 
0001 0100 
0001 0101 
0001 0110 
0001 0111 
0001 1000 
0001 1001 
0010 0000 
0010 0001 
0010 0010 
0010 0011 
0010 0100 
0010 0101 
0010 0110 


) ù où Où où ù eh où. mb 
> © © 1 O O1 R © ND 


À Tableau l: 

les systèmes de numération 
habituellement utilisés 

en informatique. 


À Tableau I! : 
type de code 
autocorrecteur. 


0000001 


1000010 


0101011 
0100100 
1001101 
0001110 
1100111 
0011000 


1110001 


— Codes autocorrecteurs (codes de Hamming) 
Dans le cas où une erreur peut provoquer des consé- 


quences inacceptables, il existe un procédé de codage 


permettant de localiser une erreur, donc de la corriger 
puisque le caractère est binaire. Supposons qu'un 
code contienne initialement n bits. On va chercher, en 
ajoutant p bits de parité à ce code, à déterminer, 
en cas d'erreur, quel est le bit erroné. Le code obtenu 
comporte en tout 7» + p bits; l'information recherchée, en 
cas d'erreur, sera le numéro du bit erroné et doit être 
fournie par les p bits supplémentaires. On doit donc avoir 
22>n+p+i. 
En effet, on considère les cas suivants : 

1 : Pas d'erreur. 

2 : Erreur sur le premier bit. 

3 : Erreur sur le second. 


n + p : Erreur sur le n + p — 1-ième bit. 
n + p + 1 : Erreur sur le n + p-ième bit. 
Soit en tout, n + p + 1 cas différents. 
On peut donc a priori dresser une table du nombre 
minimal de bits supplémentaires, en fonction du nombre 
de bits du code initial : 


Mn. 2486 & 56-011, 12 18 %:, 26 
p 2 3 3 3 4 4 4 5 5 5 


Nous allons mettre en place un tel code, en prenant par 
exemple : n — 4 donc p = 3. Ces trois bits seront des 
bits de parité, portant chacun sur une partie seulement 
du code. En vérifiant la parité de chaque groupe, nous 
pouvons fabriquer un nombre binaire de 3 bits, chaque bit 
valant O si la parité du groupe correspondant est correcte, 
1 si elle est incorrecte. Cherchons à déterminer ces grou- 
pes, de telle facon que le nombre obtenu soit le numéro 
du bit erroné s’il y a erreur et 000 dans le cas où le code 
est correct. 

Écrivons les valeurs binaires correspondant aux nom- 
bres de 1 à 7: 


C1 


Q 
1Ÿ 


C3 


SJ O O1 PR © N — 
ss 000O 


sO0-0-— 
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On voit qu'un contrôle de parité doit porter sur le groupe 
4 5 6 7, pour déterminer le bit c1, puisque celui-ci doit 
être à 1 si et seulement si une erreur s'est produite dans 
ce groupe ; un contrôle doit porter sur 2 3 6 7 pour déter- 
miner c2 et sur 1 3 5 7 pour déterminer cs. Donc, il faut un 
bit de parité dans chacun de ces groupes. Les bits 1, 2 
et 4 ne figurent chacun que dans un groupe. Ce sont donc 
ceux-là que l'on va choisir comme bits de parité, les 
bits 3 5 6 7 représentant le code initial. Pour éviter les 
confusions, on attribue aux bits les numéros corres- 
pondant à leur place dans le code résultant bien que le 
raisonnement précédent ne repose que sur la notion de 
numéro attribué au bit (ainsi, on pourrait numéroter les 
bits dans l'ordre 7 461 523 au lieu de1 23456 7). 

Le tableau || montre un code de Hamming impair obtenu 
à partir du code DCB. 

On peut vérifier l'effet de correction sur un exemple : 
Soit le code de 5 : 1001101 
changeons un bit : 1001001 
Parité 1 3 5 7 : paire. Erreur, c1 = 1 
Parité 23 6 7 :impaire. Correct, c = 0 
Parité 4 5 6 7 : paire. Erreur, c3 = 1 
d'où c1c2c3 — 1 0 1, soit 5 en décimal; c'est bien le 5° bit 
qui avait été changé. 

Ce procédé permet donc de corriger une erreur; 
cependant, s'il y a deux erreurs, il est impossible de s'en 
rendre compte. Pour cela, on peut ajouter un bit de parité 
supplémentaire portant sur la totalité des bits. En cas 
d'erreur double, les contrôles de parité partiels ne seront 
pas satisfaits, alors que le contrôle total sera satisfait. 

Ces divers procédés relèvent d'une notion qui est la 
notion de distance dans un code. Sans préciser exacte- 
ment de quoi il s'agit, disons simplement, en raisonnant 
de manière intuitive, que plus les messages (ou mots) 
possibles d'un code sont différents entre eux, plus on a de 
chances de pouvoir corriger des erreurs, en choisissant 
d'interpréter systématiquement un mot erroné comme 
provenant du mot qui lui ressemble le plus dans le code : 
on suppose en effet que les erreurs multiples susceptibles 
de changer complètement l'aspect du message sont beau- 
coup moins probables que les erreurs simples n'appor- 
tant que de légères modifications. 

Nous voyons qu'il est théoriquement possible de s'af- 
franchir des erreurs, mais en pratique on est conduit à 
utiliser des codages plus longs que si on était sûr de ne 
pas avoir d'erreurs. Ceci a des conséquences économiques 
non négligeables. En effet, pour une capacité donnée de 
stockage, transmission ou traitement de l'information, 
on utilise une partie de cette capacité et du temps de 
traitement pour faire des contrôles sur de l'information 
redondante. || est donc souhaitable de chercher à réaliser 
du matériel assez fiable pour n'avoir à faire que des 
contrôles simples (par exemple, contrôle de parité), en 
sachant que ces contrôles couvrent pratiquement tous les 
risques d'erreurs pouvant subsister. Cette condition aug- 
mente évidemment les coûts d'études du matériel, mais 
permet de réduire le coût d'exploitation. 


Éléments de logique 


Physiquement, les calculateurs électroniques ne réali- 
sent que des opérations logiques. Nous verrons que 
certaines conventions permettent d'effectuer certaines 
opérations telles que des opérations arithmétiques, à l'aide 
d'opérations logiques. 

Une variable logique est une variable ne pouvant pren- 
dre que deux valeurs : vrai ou faux. Conventionnellement, 
on représente ces valeurs respectivement par 1 ou O, 
mais il ne faut pas attribuer à cette représentation un sens 
arithmétique (on pourrait aussi bien utiliser les symboles V 
et Fou — et—, etc.). 

Une fonction logique de variables logiques est une 
fonction qui, pour toute combinaison des valeurs des 
variables, prend soit la valeur vrai, soit la valeur faux. 
Soit n variables logiques indépendantes, il existe 27 com- 
binaisons différentes des valeurs de ces variables, puis- 
que chacune peut prendre deux Valeurs; pour chaque 
combinaison, une fonction logique peut prendre deux 
valeurs, il existe donc 22* fonctions logiques différentes 
de n variables logiques. 

On peut représenter une fonction logique à l'aide d'une 
table de vérité, en plaçant dans une colonne les combi- 
naisons des variables, et dans une autre les valeurs cor- 
respondantes de la fonction. 


Fonctions d’une variable 
Il y en a quatre différentes (tableau lil) : 


La seule intéressante est la fonction F2, appelée complé- 


mentation. On la représente par F2 (a) = a, la barre 
indiquant la complémentation. 


Fonctions de deux variables 

Il y en a 22°, soit 16. Certaines ont des propriétés inté- 
ressantes pour l'application pratique dans la réalisation 
des circuits logiques électroniques. Nous allons en exa- 
miner quelques-unes (tableau IV) : 


F1: fonction intersection, ou fonction ET 
Notation F1 (a, b) = a A boua:b 
F6 : fonction OU EXCLUSIF 
Notation F6 (a, b) = a ® b 
F7: fonction réunion, ou fonction OU 
Notation F7 (a, b) — a V b oua+b 
Fs : fonction exclusion ou fonction NI 
Notation Fs (a, b) = a | b 
Cette fonction est complémentaire de F7, on peut 
donc écrire Fs — F7. Pour cette raison: on adopte 


plus souvent la notation Fs = a V b ou a + b 
F13 : fonction implication 

Notation F13 (a, b) = a = b 
F14 : fonction incompatibilité 

Notation F14 (a, b) = a | b 

On adopte plus souvent la notation F14 = a * b 


ou a À b 


On appelle aussi cette fonction NON-ET 

En effet, on voit que F14 = F1 
Les fonctions 1, 6, 7, 8, 14 sont commutatives. 
Les fonctions 1, 6, 7 sont associatives, c'est-à-dire : 
(a*b)°:c—a:(b:c) onpeut doncécrirea*b'c 
(av b)vc=av (bVvc)=avVbvoe 
@@b)@c-a@(b@c)=a®@b@0c 


Les fonctions ET (1) et OU (7) sont distributives l’une 
par rapport à l’autre, ce qui s'exprime par: 


a (bV c) = (a: b) V (a-c) 
a V (bc) = (a V b):(a V 0) 
Elles ont également les propriétés suivantes, qu'il est 
facile de vérifier en s’aidant des tables de vérité : 
— Propriété d'idempotence :a°a— a 
aVa—=a 
a*(a V b)=a 
a V (a°b)=a 
a°1+ 2 
av 0=a 
1 et O sont respectivement éléments neutres des fonc- 
tions ET et OÙ. 
La fonction OU EXCLUSIF (F6) possède la propriété 
suivante : 


— Propriété d'absorption : 


— Élément neutre : 


a@i-=4 
a 


— Théorème de Morgan : 
a'b=a tb 


Décomposition canonique des fonctions logiques 
Soit F (a, b, c, …) une fonction de piusieurs variables, 
on peut l'écrire sous la forme suivante : 
F (&.b;6.) = EF (,.0.0c.) v @°FP\(0;,b;:0c:) 


car si a vaut 1, a vaut O et seul F (1, b, c..) compte, 
de même si a vaut O0 seul F (0, b, c...) compte. 

F (1,b, c.….) et F (0, b, c...) peuvent se décomposer de 
la même façon. Par exemple, prenons le cas d'une fonc- 
tion de trois variables F (a, b, c) : 


F&.b;c)=%: EF (8,60) V a°F1(0,#;0) 

On peut continuer : 
F(1,b,c)=b-F(1,1,c) V b°F(1,0,c) 
et F (0,b,c)=b:F(0,1,c) V b°F (0,0, c) 


En décomposant de même les quatre nouveaux termes 
et en reportant dans F (a, b, c), on obtient : 


F(ab,c)=atb:c:F(1,1,1)Va-b-c:F(1,1,0) 
Va-b:c:F(1,0,1)Va-b:c:F(0,1,1) 
Va-b:c:F(1,0,0)Va-b-c:F(0,1,0) 
V a-b:c:F(0,0,1)va-b-c°F(0,0,0) 


En remplaçant F (0, O, O0), F (0, 0, 1), etc., par les valeurs 
tirées de la table de vérité, la fonction se réduit à une réu- 
nion d'intersections dans lesquelles interviennent toutes 
les variables, soit sous forme directe, soit sous forme 
complémentée. Ces intersections sont appelées intersec- 
tions de base. 
Exemple 

Soit la fonction de trois variables définie par sa table 
de vérité : 


a b e F 

0 (e] 0 (o) 

(o) (o) 1 1 

0 1 (e) 0 

0 1 1 1 

1 0 | O0 1 

1 0 1 0 

1 1 (e] 1 

1 1 1 0 | 
EE | 


On peut écrire F de la façon suivante : 
F=3-b-cva-b-cVva-b-cVva-b:c 


Cette facon d'exprimer une fonction logique à partir 
des intersections est appelée première forme normale 
ou première forme canonique. Il en existe une seconde qui 
consiste à exprimer la fonction par une intersection de 
réunions, appelées réunions de base. 

Il nous suffit de la première pour remarquer que toutes 
les fonctions logiques, quel que soit le nombre de variables, 
peuvent s'exprimer en utilisant seulement les fonctions 
ET, OÙ et complémentation. En fait, on aurait pu intro- 
duire ces opérations de facon axiomatique. En effet, un 
ensemble muni d'opérations possédant les propriétés des 
fonctions ET, OÙ, complémentation, décrites ci-dessus, 
possède une structure d'algèbre de Boole. 
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< Tableau Ill : 
les 4 fonctions 
d'une variable 
(Var = variable, 
F = fonction). 


< Tableau IV : 
table de vérité 
des fonctions 

de deux variables. 


Les machines à calculer 
électroniques de poche 
ne comportent souvent 

qu'un seul circuit intégré. 


D'un point de vue pratique, on dit que ces trois fonc- 
tions constituent un groupe complet, car elles permettent 
la réalisation de toutes les fonctions logiques. Les fonc- 


tions a * b et a V b sont particulièrement intéressantes, 
car chacune forme à elle seule un groupe complet; on 
peut en effet réaliser les fonctions ET, OÙ et complé- 
mentation en utilisant l’une ou l'autre de ces deux fonc- 
tions comme le montrent les relations suivantes, faciles à 
vérifier : 


®% | 
I 
% 
% 


%1 
[ 


Figures 2, 3, 4: 

trois exemples de réalisation 
des fonctions logiques 

à l'aide d'éléments 
électromécaniques. 


Figure & : 

représentation schématique 
des états électriques 

des circuits logiques. 


a*b= (a:b) 


a*b= (a V a) V (b V b) 


(a*b) a V b= (2-2) - (b:b) 


a V b= (a V b) V (a V b) 


Réalisation des fonctions logiques 

Les premières réalisations furent à base de contacts 
électriques et de relais. Deux contacts placés en série dans 
un circuit constituent un opérateur ET, car ils doivent être 
tous les deux fermés pour que le circuit électrique soit 
fermé. Deux contacts en parallèle constituent un opé- 
rateur OU. Un contact « à ouverture » ouvrant le circuit 
lorsqu'il est actionné constitue un opérateur de complé- 
mentation. 
Exemples 

Quand A et B sont actionnés, la lampe L s'allume. On 
peut écrire L= A :B (fig. 2). 


Richard Colin 


Quand A ou B (ou les deux) est actionné, la lampe L 
s'allume. On peut écrire L— A V B (fig. 3). 


fig. 3 AL 


BL 


Richard Colin 


Une commande en « va-et-vient » d'après la figure 4 
peut être représentée par la fonction L = A:B V A :B. 


Richard Colin 


Les premiers calculateurs électron; ques furent réalisés 
avec des tubes électroniques (dioces, triodes, thyra- 
trons, etc.). Le développement des transistors, puis des 
circuits intégrés a fait considérablement évoluer la techno- 
logie. En effet, les fabricants de circuits intégrés offrent 
actuellement des gammes très étendues de circuits, depuis 
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les plus simples jusqu'aux plus complexes (les machines 
à calculer électroniques de poche ne comportent souvent 
qu'un seul circuit intégré). Pour un ingénieur ayant à 
concevoir un organe d'ordinateur, ces circuits constituent 
des « boîtes noires », car il n’est pas nécessaire de connaître 
en détail comment ils sont faits, mais plutôt comment on 
doit les utiliser. 

Ces circuits ont deux états électriques possibles. Un 
état correspond à une tension électrique supérieure à un 
seuil haut, l’autre à une tension inférieure à un seuil bas. 
Les circuits sont conçus de telle façon qu'ils ne peuvent 
pas prendre un état stable entre les seuils haut et bas en 
utilisation normale. Deux conventions sont possibles pour 
attribuer une valeur logique à ces niveaux électriques. En 
logique positive, le 1 logique est représenté par le niveau 
haut, en logique négative, le 1 est représenté par le 
niveau bas (fig. 5). 


Logique positive Logique négative 


Les noms donnés aux circuits correspondent aux fonc- 
tions réalisées en logique positive. Voici les circuits 
simples les plus courants et leurs représentations. 


fig. 6 
Circuit inverseur 


Porte ET 


Porte OU 
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En logique négative, une porte ET réalise en fait une 
fonction OÙ etréciproquement (voir Théorème de Morgan) 


[fig. 61. 


fig. 7 


Porte NON-ET ou NAND 


Porte Ni ou NOR 


Richard Colin 


En logique négative, une porte NAND réalise une fonc- 
tion NI et réciproquement (voir Théorème de Morgan) 


fig. 71. 


£|fig. 8 

o a aëb 
<| Circuit OU EXCLUSIF b — ) d— 
Ê 


Les schémas de la figure 9 représentent la fonction 
S = ab V b:c en logique positive. 


Richard Colin 


Une catégorie importante de circuits est constituée par 
les circuits séquentiels. Nous n'avions considéré que des 
fonctions logiques, dont les sorties ne dépendent que de 
l'état des entrées. Dans les circuits séquentiels, l'état 
des sorties dépend de l'état présent et des états précé- 
dents des entrées. 

Considérons la figure 10: 


fig. 10 
Q2 = Sv Q: 


Q: = Rv Q2 


Flip Flop RS. 


Richard Colin 


Supposons S=R—0 et O1 = 1. 
Ona alors: @Q—sSVO=0v1—-0 
d'autre part : Oy= R V = 0 V 0 = 1. Il n'y a pas 
contradiction avec l'hypothèse Q1 = 1. Cet état est donc 
possible. Supposons toujours : S—R—0 et O1 = 0 


on a alors = SVvVOA—=0v0—=1 
et O, = R V v 1=0 


[æ) 


Cet état est aussi possible. Ce circuit a donc deux états 
possibles quand R = S — 0. Supposons qu'il soit dans 
l'un de ces états, et que S devienne égal à 1. 


On aura Q = 1 VO —=0 quel que soit O; 
et QA=RVO=0vVO—1 


Si S redevient égal à O0, O2 est maintenu à 1 par O1 et O1 
à O par Oz. Cet état, étant stable pour R = S = O0, subsiste 
après que S soit redevenu égal à 0. Si on fait passer 
S plusieurs fois à 1 puis revenir à O, l'état des sorties ne 
change pas, si R reste toujours à ©. 

Par contre si c'est R qui passe à 1, puis revient à O, c'est 
Q2 qui prend la valeur 1 et O: la valeur O. Ce circuit permet 
donc de transformer une information passagère (passage 
temporaire à 1 puis retour à 0) en une information perma- 
nente. || réalise donc une fonction de mise en mémoire. 
Selon l'état des sorties, on peut savoir laquelle des deux 
entrées est passée à 1 la dernière. Remarquons que si les 
deux entrées sont simultanément à 1, on aura O1 = O2= O. 
Lorsque les entrées reviendront à O, c'est la dernière à 
revenir à O qui déterminera l’état du système. Un tel circuit 
est appelé Flip Flop R.S. 

Considérons maintenant la figure 11 : 


Q2 
Flip Flop D 
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L'entrée C est appelée entrée d'horloge où entrée d'écri- 
ture. Par rapport au Flip Flop R. S., nous avons ajouté 
un inverseur et deux portes. En l'absence de l'impulsion 
d'horloge (C = 1), on a A = B = 0; on a donc soit 
Q; = 0, Q2 = 1, soit O1 = 1, O2 = 0. Pendant l'impul- 
sion d'horloge (C = 0), on a A = D et B = D, donc un 
des points À et B est à O, l'autre à 1. Les sorties O1 O2 
vont prendre l’état correspondant, à savoir O1 = 1, O2 = 0 
si D — 1 et O1 — 0, Q: — 1 si D = 0 pendant l'impulsion 
d'horloge. 

Ce circuit permet donc de mémoriser l'état de l'entrée D 
au moment de l'impulsion d'horloge seulement. 

Un tel circuit est appelé Flip Flop D. C'est un circuit dit 
de type synchrone, car il ne peut changer d'état qu'au 
moment de l‘impulsion d'horloge, contrairement au Flip 
Flop R.S. (appelé asynchrone). 


Structure et fonctionnement 
des ordinateurs 
Arithmétique binaire dans les calculateurs 


L'addition en binaire peut se réaliser simplement, chiffre 
à chiffre, comme en décimal, en utilisant la table d'addition: 


0+0—=0 

0 l= 1 

1 E0= 1 

1—+1—10 Soit O et un report égal à 1. 
Exemple 


() (1) 
Ÿ 1 + © © 


110 1.0 1 


D APT O0 1001 


Nous voyons que la table d'addition en binaire présente 
une grande ressemblance avec une table de vérité de 
fonction logique. On peut donc convenir de représenter 
un chiffre binaire par une variable logique. Pour simplifier 
les conventions on représentera le 1 de la numération 
à base deux par un 1 logique (le contraire serait possible). 
Dans ces conditions, l'addition consiste à déterminer 
chaque chiffre du résultat et la retenue en fonction des 
chiffres de même rang des opérandes et du report du rang 
précédent. On peut donc définir deux fonctions logiques : 
la somme modulo 2, S et la retenue R, de trois variables 
a, b, R’; a et b représentent les chiffres des nombres à 
additionner, R’ la retenue précédente. 
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<« Figures 6, 7,8: 
représentation de circuits 
simples les plus courants 
correspondant 

à des fonctions réalisées 
en logique positive. 
Figure 9 : 

exemple de réalisation 
d'une fonction logique 

à partir de fonctions 
élémentaires. 


<« Figure 11; 
circuit séquentiel 
de type synchrone : 
Flip Flop D. 


<« Figure 10; 
circuit séquentiel 

de type asynchrone : 
Flip Flop R.S. 
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Les fonctions peuvent s'écrire 


S—a@b@R 
R=a°bVb'RVa:R 


On pourra, par exemple, réaliser ces fonctions à l'aide de 
circuits logiques suivant la figure 12. 

Nous pouvons enfermer ce circuit dans une « boîte 
noire » et le représenter désormais par la figure 13. 


Y A gauche, figure 13 : 
circuit de la figure 12 
enfermé dans une « boîte 
noire ». 

A droite, figure 12 : 

un additionneur binaire. 


Y Figure 14 : 
additionneur parallèle 

à n bits. 

Figure 15 : représentation 
de la soustraction À — B. 
Figure 16 : additionneur 
soustracteur parallèle. 
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Additionneur binaire 


En mettant en parallèle plusieurs circuits identiques, 
on pourra effectuer une addition, chaque report étant 
envoyé sur l'étage suivant (fig. 14). 


bn 


v+ 
js. 


bn 


Li di. 
A 


Dan: 


an 


S2 S: 
Additionneur parallèle à n bits 
Dn-1 a2 FE b. 


An An-1 


fig. 16 


CUE 
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Si on utilise une représentation des nombres sur n bits, 
il se peut que le résultat réel s'exprime sur n + 1 bits 
(Report Rx = 1). Dans ce cas il se produit un dépasse- 
ment de capacité, car le bit supplémentaire est perdu. En 
général la retenue R, est mémorisée, ce qui permet après 
l'opération de vérifier s'il y a eu ou non dépassement. 
Si on dispose de n bits on peut représenter naturellement 
les nombres de O à 22% — 1. On voit que si on ajoute 1 
à 2% — 1, on obtiendra, avec notre additionneur, 0 comme 
résultat et un dépassement de capacité. L'additionneur 
travaille donc modulo 2*. On peut utiliser cela pour traiter 
des nombres négatifs. En effet, soit p, 0 < p < 271, 
ona:—p—=2*— p (Mod. 2*); on peut donc repré- 
senter — p par 2% — p qui est positif. Pour qu'une confi- 
guration binaire ne puisse pas représenter deux nombres 
différents, on représente de cette facon les nombres de 
— 2-1 à 22-11, Soit 0 < p < 2*-1, p contient 
au maximum »7 — 1 bits significatifs, donc le premier bit 
est 0; —p est représenté par p’— 27% p, donc 
2% -1< p’ < 2%— 1, donc le premier bit vaut 1. Le 
premier bit permet donc de connaître le signe d'un nombre. 
Cette représentation appelée « complément à 2 » est très 
souvent utilisée dans les calculateurs électroniques. Pour 
obtenir le complément à 2 de p, on complémente chaque 
bit et on ajoute 1 au résultat. 
Exemple : soit n = 5 
D'=8 en binaire p = 00011 
on complémente les bits : 11100 


on ajoute 1 : 11101 = — p 


Vérification : 


00011 
11401 
(100000 


Le dernier report étant le dépassement, le résultat sur 
5 bits est bien O. 

En représentant ainsi les nombres pour faire l'opération 
p—g (ou p—+ (—g)), on fait en réalité l'opération 
p + 2% — q,soit 2% + p — q.Sip — q > 0, le résultat est 
plus grand que 27, il y a dépassement et il reste p — q qui 
est le résultat cherché. Si p — q < O0, le résultat est infé- 
rieur à 2%, il n'y a pas de dépassement. On peut écrire 
22% + p— q = 2% — (q — p). On obtient donc un résul- 
tat représentant un nombre négatif, puisque dans ce cas 
g— p > 0. On dispose ainsi d'un moyen pour faire des 
additions algébriques et des soustractions. Pour soustraire 
un nombre, on additionne son complément à 2. 

On peut représenter la soustraction À — B par la fig. 15. 


On applique sur les entrées les niveaux logiques a et b 
et 1 sur l'entrée de report du 1°" étage, ce qui revient à 
former le complément à deux de B. 

Si on veut pouvoir réaliser au choix une addition ou une 
soustraction, il faut avoir la possiblité de complémenter 
ou non les entrées b et d'appliquer un niveau O ou 1 sur 
l'entrée de report. La complémentation peut se faire à 
l'aide d'un circuit OU EXCLUSIF d'après la figure 16. 

Si P vaut O, les bits b ne sont pas complémentés et Ro 
vaut 0, on fait donc l'opération À + B. Si P vaut 1, les 
bits b sont complémentés et Ro vaut 1, l'opération est 
donc A — B. 

Nous pouvons donc réaliser ces opérations. Cependant 
il faut que les opérandes soient présents sur les entrées et il 
faut prendre en compte le résultat. Pour cela, on utilise des 
registres. Un registre est un ensemble de flips flops 
permettant de mémoriser en même temps plusieurs bits. 
Le nombre et le rôle exact des registres varient d'un type 
de calculateur à l’autre. Cependant, on trouve très souvent 
la structure de la figure 17. 


fig. 17 
Registre données £ 


Accumulateur 
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Opération dans l’accumulateur 


Un registre (RD) contient un opérande. Un autre registre 
(AC) contient l’autre opérande et sert à stocker le résul- 
tat. En pratique, l'opération se déroule ainsi : RD et AC 
sont chargés avec les opérandes. Leurs sorties étant 
connectées sur les entrées du circuit arithmétique, le 
résultat apparaît sur les entrées de AC. Une impulsion 
d'écriture dans AC mémorise le résultat à la place du 
contenu précédent, qui est perdu. Cette structure permet 
d'additionner (ou soustraire) successivement plusieurs 
nombres, en ajoutant chaque fois un nouveau nombre au 
contenu de l’accumulateur (d'où le nom d'accumulateur). 


Multiplication - Division 


La multiplication se fait en binaire comme en décimal, 
en multipliant le multiplicande par chaque chiffre du 
multiplicateur, et en ajoutant chaque fois le résultat décalé 
d'une position vers la gauche. En binaire, l'opération est 
particulièrement simple puisqu'on n'a à multiplier que 
par 0 ou 1. L'opération se réduit donc à des additions et 
des décalages. 


Exemple : 
0010 
K 1 0 1 T1 1 
10010 
+ 10010 
+ 4 0: 0: 1 © 
— 00000 
+ 10010 
= À 1 @O: 1 1 1 À 0 


Si les nombres sont exprimés sur n bits, le résultat peut 
avoir 2 n bits. En effet : 


(27—1) x (27—1) = 22m 2n+14+ 7 


La multiplication demande donc une capacité doublée. 
Pour cela, on associe à l’accumulateur un deuxième 
registre, appelé souvent MQ (Multiplicateur Quotient). 
On peut remarquer, cependant, que chaque addition ne 
porte que sur n bits, les bits de poids inférieur n'interve- 
nant plus, l’un après l’autre. On peut alors réaliser la multi- 
plication d’après l'algorithme qui suit. 

Initialisation : on met AC à 0. On charge le multi- 
plicande dans RD, le multiplicateur dans MO (fig. 18). 
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1 — Si le bit le plus à droite de MQ vaut 1, passer à 
l'étape 2. Sinon passer à l'étape 3. 

2 — Additionner le multiplicande au contenu de AC. 

3 — Décalerle contenu de l'ensemble AC — MO d'une 
position vers la droite; le dernier bit de MQ est perdu. 
Décaler le résultat de l'addition à droite est équivalent à 
décaler le multiplicande à gauche lors de l'addition sui- 
vante. 

4 — Recommencer n fois l'opération à partir de 1. 
Après n opérations le résultat se trouve dans l'ensemble 
AC — MO. 

On peut en déduire une méthode pour effectuer les 
divisions par soustractions successives, similaire à la divi- 
sion en décimal. 


Initialisation : charger le dividende dans AC — MO, 
le diviseur dans RD. 
1 — Soustraire le contenu de RD (diviseur) du contenu 


de AC (poids forts du dividende). 
Si le résultat dans AC est négatif, passer à l'étape 2. 
Si le résultat est positif, passer en 3. 
2 — Le dividende est plus grand que les poids forts du 
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diviseur. Le chiffre obtenu pour le quotient est 0. Restaurer 
la valeur initiale de AC en ajoutant le dividende, puis 
passer à l'étape 4. 

3 — Le chiffre obtenu pour le quotient est 1. 

4 — Décaler le contenu de l'ensemble AC — MQ 
d'une position à gauche, en rentrant à droite de MO la 
valeur trouvée pour le chiffre du quotient. 

5 — Recommencer n fois l'opération à partir de 1. 
Après n opérations, le quotient se trouve dans MQ et le 
reste dans AC. 


Unité arithmétique et logique (U. A. L.) 


Avec un additionneur et des registres, il est possible de 
réaliser les quatre opérations arithmétiques. Il est facile 
d'imaginer effectuer d'autres opérations entre registres, 
toujours d'après le même principe (fig. 19). 


Commande 


Opération dans l’U.A.L. 


Cet ensemble constitue l'unité arithmétique et logique. 
En fait, on peut en donner une définition plus générale 
comme étant un ensemble de circuits réalisant des opéra- 
tions à caractère arithmétique ou logique entre les conte- 
nus d'un certain nombre de registres (fig. 20). Certaines 
opérations peuvent ne concerner qu'un seul registre. 


Le 
Em] Registres 


Commande 


Mémoire 


L'un des points importants pour le traitement automa- 
tique est la nécessité pour l'organe de traitement de pou- 
voir stocker des informations. Il faut distinguer entre deux 
sortes de mise en mémoire. 

— Stockage d'information en vue d'une utilisation 
ultérieure (par exemple des données ou des résultats 
d'un calcul). Dans ce cas il s’agit de produire ces infor- 
mations sous une forme facile à réutiliser si besoin est. 

— Stockage des informations immédiatement néces- 
saires à la conduite du traitement et à l'obtention des 
résultats. Dans ce cas, il faut pouvoir accéder rapidement 
à n'importe quelle information. Pour cela les calculateurs 
sont munis d'une mémoire centrale. La mémoire centrale 
est constituée d’un très grand nombre de registres, appelés 
aussi « mots mémoire », destinés à mémoriser les données 
d'un problème et les informations relatives au déroule- 
ment du traitement (le programme). 

À mesure que le traitement s'effectue, les informations 
nécessaires sont transférées de la mémoire dans des 
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<« Figure 19: 

OP désigne ici un circuit 
qui réalise l'opération 
spécifiée par les signaux 
de commande. 


« A gauche, figure 18 : 
schéma de l'initialisation 


pour réaliser 


la multiplication. 

A droite, figure 20 : 
opération dans l'U. À. L. 
entre les contenus 

d'un certain nombre 

de registres. 


<« Page ci-contre, figure 17: 
structure permettant 

la réalisation d'opérations 
dans un accumulateur. 
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registres de l'U. A. L. ou d’autres registres, pour y être 
traitées. Des résultats peuvent être transférés de l'U. A. L. 
vers la mémoire. 

Une information en mémoire est repérée par le numéro 
du registre qui la contient. C'est ce qu'on appelle l'adresse 
du mot mémoire. 

A la mémoire sont associés deux registres particuliers. 

— Le registre d'adresse mémoire (R.A.M.). Lors- 
qu'on veut accéder à un mot mémoire, son adresse est 
chargée dans le R.A.M. Un circuit décodeur d'adresse 
met alors le mot sélectionné en communication avec le 
registre de données mémoire. 

— Le registre de données mémoire. C'est par ce regis- 
tre que transitent toutes les informations échangées entre 
la mémoire et d’autres organes du calculateur (fig. 21). 


Aiguillage 


il 


R.A.M. 


A Figure 21 : représentation schématique de l'organisation de la mémoire. 


Page ci-contre, à gauche, figure 22 : structure de l'unité de contrôle. 


Y À gauche, partie interne de l'unité centrale d'un système 360/1BM. 
À droïte, partie interne d'un calculateur électronique. 


1.B.M 
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Certains calculateurs ont une partie de leur mémoire 
constituée de flips flops électroniques, ce qui permet 
des échanges très rapides. Cependant, dans la grande 
majorité des cas, la mémoire est constituée de tores de 
ferrite. La ferrite présente un cycle d'hystérésis presque 
rectangulaire. Lorsqu'elle est excitée par un courant élec- 
trique circulant dans un circuit primaire, elle prend une 
aimantation dont le sens est lié au sens du courant. L'ai- 
mantation subsiste après l'arrêt du courant; si on force 
l'aimantation à changer de sens, on peut recueillir une 
impulsion électrique dans un circuit secondaire. On peut 
donc associer un sens d'aimantation à O et l’autre à 1. 
On écrit donc un O0 ou un 1 selon le sens du courant d'exci- 
tation. En lecture, on force l'aimantation dans le sens cor- 
respondant à 0. S'il y a changement de sens, c'est-à-dire 
si l'information était 1, on obtient une impulsion élec- 
trique au circuit secondaire (circuit de lecture). 

Un tel procédé de lecture est destructif puisqu'on 
efface l'information pour la lire. A la lecture, l'information 
est transférée dans R.D.M. Les circuits sont conçus de 
façon à effectuer automatiquement une réécriture de 
l'information dans le mot qui vient d'être lu; ainsi l'infor- 
mation reste en mémoire. 

Les mémoires à ferrite constituent des mémoires per- 
manentes; elles gardent l'information même si l'alimen- 
tation électrique du calculateur est coupée, contrairement 
aux registres électroniques qui perdent l'information dans 
ce cas. 


Unité de contrôle - Instructions machine 


Nous avons vu le principe selon lequel les opérations 
sont effectuées dans l'U.AL. et les échanges avec la 
mémoire. Ces opérations nécessitent certains signaux de 
commande qui peuvent être soit des niveaux logiques 
appliqués sur certaines entrées, destinées à déterminer 
l'opération à effectuer, soit des impulsions destinées à 
commander successivement les différentes phases de 
l'opération. Ces signaux sont délivrés par l'unité de 
contrôle, qui comporte essentiellement deux éléments : 

— Un registre d'instructions (R.I.) destiné à rece- 
voir les instructions, associé à un décodeur d'instruction 
qui, en fonction du code contenu dans R.I., génère les 
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niveaux logiques de commande et d'aiguillage des impul- 
sions d'horloge. 

— Une base de temps qui génère en permanence 
toutes les impulsions qui peuvent être nécessaires. Ces 
impulsions sont aiguillées vers les circuits correspondants 
par le décodeur d'instructions. 

Chaque instruction correspond à une opération élé- 
mentaire réalisable par les circuits des différentes unités. 
Ces instructions sont évidemment codées en binaire. Ce 
code constitue le langage machine. C'est le seul que l'unité 
de contrôle peut « comprendre » (fig. 22). 


fig. 22 
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Généralement, une instruction comprend plusieurs 
parties qui sont décodées séparément : 

— Une partie « Code Opération » qui indique le type 
d'opérations à effectuer. 

— Une partie « opérandes » qui spécifie où et com- 
ment les opérandes doivent être pris. Selon les opérations, 
les opérandes peuvent être soit en mémoire, soit dans 
l'U.A.L.,, soit dans l'instruction elle-même. Cette partie 
est donc interprétée en fonction du code opération. 
A priori, le nombre d'opérandes dépend de l'opération. 
Par exemple, pour une division, on pourrait faire figurer 
dans l'instruction les adresses où prendre le diviseur, le 
dividende, et où ranger le quotient et le reste. Cela ferait 
quatre adresses à faire figurer dans l'instruction. D'autre 
part, les instructions d'un programme étant stockées en 
mémoire, on pourrait également faire figurer l'adresse 
de l'instruction suivante à exécuter. 

En fait, dans la plupart des cas, on ne fait figurer qu'une 
adresse par instruction machine, en décomposant cer- 
taines opérations en plusieurs étapes de nature différente : 

— transferts d'un seul opérande à la fois entre 
mémoire et U.A.L.; 

— opérations portant sur un seul opérande pris en 
mémoire, les autres étant pris dans l'U.A.L. 

Ainsi une addition peut se faire en trois instructions : 

— charger l'accumulateur avec le premier opérande; 

— additionner le deuxième opérande au contenu 
de l’accumulateur; 

— ranger le contenu de l'accumulateur (résultat) 
en mémoire. 

Une telle décomposition est avantageuse pour les 
calculs enchaïînés. On n'a pas toujours besoin de ranger 
en mémoire des résultats intermédiaires, ils restent dans 
l'accumulateur (ou dans d'autres registres de l'U.A.L.). 

Pour la succession des instructions, on range simple- 
ment les instructions successives à des adresses consé- 
cutives. Dans certains cas, après une opération, il faut 
effectuer une séquence d'instructions qui n'est pas 
rangée immédiatement à la suite. Cela peut se faire par 
une instruction de branchement, qui n'effectue aucune 
opération, mais qui indique à l'unité de contrôle l'adresse 
où commence la séquence suivante. Cela permet les 
ruptures de séquence, notion fondamentale pour l'utili- 
sation des ordinateurs. 


Les ruptures de séquences 


Il est souvent nécessaire de prendre des décisions en 
cours de traitement. En fonction de certains résultats, 
la suite des calculs peut se dérouler de différentes façons 
(voir l'exemple d'équation du second degré en début d’ar- 
ticle). La décision consiste à choisir la séquence suivante, 
au moyen d'instructions de branchement (fg. 23). Ces 
décisions ne sont possibles que si on peut effectivement 
accéder à n'importe laquelle des séquences possibles. 
On voit ici apparaître l'importance de la notion de pro- 


gramme enregistré. Si tout le programme est présent en 
mémoire, n'importe quelle séquence est accessible à tout 
moment. Au contraire, si les opérations étaient comman- 
dées extérieurement, cela ne serait pas possible, car cela 
supposerait un changement de l'organe de commande. 
Par exemple, pour un programmateur électromécanique, 
il faudrait modifier la disposition des contacts. 

Cette notion de rupture de séquence offre plusieurs 
possibilités très précieuses : 

— Comme nous l'avons vu, on peut, par des tests 
sur des résultats, choisir la suite du traitement. 

— Boucles de programme. Lorsqu'une même 
séquence doit être exécutée plusieurs fois de suite, on 
peut, en fin de séquence, faire un branchement au début. 
Pour que le programme ne boucle pas indéfiniment, il 
faut que la séquence comporte un test de sortie de la 
boucle (fig. 24). 

Par exemple, on peut compter les itérations et se 
brancher à une autre séquence après un nombre d'ité- 
rations déterminé. 

On peut aussi tester un résultat et sortir de la boucle 
quand ce résultat répond à un certain critère; on voit ici 
que le nombre d'itérations n'est pas fixé a priori dans le 
programme mais dépend des données du problème; cela 
ne serait pas possible dans le cas d'une commande exté- 
rieure, et est donc lié à la notion de programme enregistré. 

— Sous-programmes. Lorsqu'une séquence d'ins- 
tructions doit être effectuée à différentes reprises au 
cours d'un traitement, on peut ne la faire figurer qu'une 
fois en mémoire. Lorsqu'on veut la faire exécuter, on y 
effectue un branchement en gardant en mémoire l'adresse 
d'où s'est fait le branchement. La séquence se termine 
par un branchement à l'adresse ainsi mémorisée. De cette 
façon, on peut « appeler » cette séquence nommée sous- 
programme de n'importe quel point du programme. Lors- 
qu'elle est terminée, l'exécution du programme appelant 
reprend là où elle s'était interrompue. Un sous-programme 
peut lui-même faire appel à d'autres sous-programmes. 
Cela permet, en outre, une conception modulaire du 
traitement, chaque sous-programme pouvant être écrit 
indépendamment, et utilisé par plusieurs programmes 
différents (fig. 25). 


fig. 24 
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Es Branchement 
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Branchement 
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À Figure 23 : 
organigramme 

et implantation en mémoire 
d'un traitement avec 
branchement conditionnel. 
Exécuter la séquence Si; 

si la condition C est remplie, 
exécuter S2 puis Sa 

sinon S3 puis Sa. 

Les différentes séquences 
étant les unes derrière 

les autres en mémoire, 

il est nécessaire 

de terminer S3 

par un branchement en Sa, 
pour ne pas exécuter S2 
après S3. 


<« Figure 24 : 
organigramme 

et implantation en mémoire 
d'une boucle. 


Programme appelant 


Sous-programme 
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A Figure 25 : 

exemples de branchements 
à des sous-programmes. 
Les traits doubles 
représentent des séquences 
d'instructions, 
lesflèches des branchements, 
les numéros 

l'ordre des branchements. 
Ex. 1 : /e programme P 
appelle deux fois 

le sous-programme SSP. 
Ex. 2 : /e programme P 
appelle deux fois 

le sous-programme SSP1 

et une fois SSP2. 

Le sous-programme SSP1 
appelle SSP2 une fois, 
chaque fois 

qu'il est lui-même appelé. 


» Figure 26 : 
transferts successifs 
entre les registres 

et l'unité centrale, 

lors de l'exécution 
d'une instruction 
comportant une lecture 
en mémoire. 

C.O. est incrémenté 

en même temps 

que l'instruction est chargée 
dans R.D.M. 


Figure 27 : 
instruction comportant 
une écriture en mémoire. 


Programme P 


Sous-programme SSP: 


A 


Sous-programme 
— 2,6  SSP2 
3 


S< 


Comme nous l'avons vu dans ce qui précède, les 
branchements sont souvent liés à des tests. Les instruc- 
tions de branchements conditionnels consistent en général 
à effectuer le branchement à l'adresse indiquée si une 
condition est remplie; sinon l'exécution se poursuit en 
séquence. Les conditions testées sont par exemple le 
signe du contenu de l’accumulateur, l'égalité à zéro, le 
dépassement de capacité. 


Unité centrale 


L'unité arithmétique et logique, l'unité de contrôle et la 
mémoire centrale constituent l'unité centrale. Les caracté- 
ristiques peuvent varier considérablement d'un modèle 
d'ordinateur à l’autre (taille des mots mémoire, nombre 
de mots en mémoire, nombre d'instructions élémentaires, 
temps d'exécution d'une instruction), mais tous possèdent 
cette structure générale. Certains points de structure 
relèvent de conceptions différentes. On peut citer le rôle 
des registres et le mode d'adressage. Les registres peu- 
vent être spécialisés, c'est-à-dire que chaque registre 
correspond à une fonction bien définie; on peut ren- 
contrer au contraire un certain nombre de registres géné- 
raux pouvant tous servir à un certain nombre de fonc- 
tions telles que : accumulateur, multiplicateur quotient, 
registre de base ou d'index (voir plus loin). On peut ren- 
contrer aussi différents modes d'adressage selon les 
machines. Dans certains calculateurs, les adresses sont 
obtenues directement dans les instructions. Dans d'autres, 
les instructions ne comportent qu'une adresse relative 
(appelée déplacement), définie par rapport à une adresse 
de base. A l'exécution, les adresses réelles sont obtenues 
en additionnant déplacement et base. 

Tous ces choix sont généralement dictés par des consi- 
dérations sur certaines caractéristiques telles que : taille 
de la mémoire, opérations élémentaires réalisables par les 
différents circuits opérationnels, de facon à constituer un 
ensemble cohérent et le plus performant possible. 


Déroulement d'un programme en machine 


L'exécution d'un programme en machine consiste en 
l'exécution successive d'opérations élémentaires suivant 
des séquences déterminées. Nous allons voir comment 
se déroulent l'exécution d'une instruction et l'enchaîne- 
ment des instructions. 


Recherche de l'instruction 


La première phase consiste à accéder à l'instruction 
devant être exécutée. || faut donc connaître son adresse 
en mémoire; pour cela, un registre de l'unité centrale 
contient en permanence l'adresse de la prochaine ins- 
truction à exécuter. Nous verrons comment cette adresse 
est tenue à jour. Ce registre est généralement appelé 
compteur ordinal; par la suite, il sera désigné par les 
initiales C.O. La recherche se décompose en plusieurs 
étapes : 

— Transfert du contenu du C.O. dans le registre d'adresse 
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mémoire (R.A.M.). 

— Un cycle de lecture est déclenché; le contenu du 
mot dont l'adresse est dans le R.A.M. est recopié dans le 
registre de données mémoire (R.D.M.). 

— Le contenu de R.D.M. est recopié dans le registre 
d'instruction (R.I.). À ce moment, l'instruction est en 
place dans R.I.; elle peut être décodée et exécutée. 
Simultanément, le contenu de C.O. est incrémenté, c'est-à- 
dire que C.O. contient maintenant l'adresse suivante. 


Exécution 


Le code opération de l'instruction contenue dans R.I. 
est décodé par le décodeur d'instruction qui active les 
circuits correspondant à l'opération. Il faut alors distin- 
guer entre les différents types d'opérations possibles. 

— Instructions comportant une adresse : 
e avec lecture d'un opérande en mémoire (fig. 26) 

+ la partie adresse de l'instruction est recopiée 
dans RAM; 

+ un cycle de lecture est déclenché; 

+ le contenu de R.D.M. est pris en charge par 
les circuits préalablement activés par le décodeur d'ins- 
truction, et l'opération est exécutée. 


2 (lecture) 


6 
| RDM. || VAL. 
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e instruction d'écriture en mémoire (fig. 27) : 
+ la partie adresse de l'instruction est recopiée 
dans RAM, 
+ le contenu du registre à ranger en mémoire est 
recopié dans R.D.M; 
+ un cycle d'écriture est déclenché. 
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e l'instruction est une instruction de branchement 
(conditionnel ou inconditionnel) : si les conditions de 
branchement sont réunies, ou s’il s’agit d'un branchement 
inconditionnel, la partie adresse de l'instruction est reco- 
piée dans C.O (fig. 28). 
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— Instructions ne comportant pas d'adresse 

Ce sont des opérations ne faisant pas intervenir la 
mémoire, mais uniquement des informations déjà pré- 
sentes dans les registres de l'unité centrale. L'opération 
est alors exécutée conformément à l'instruction. 

Dans tous les cas, le compteur ordinal contient l'adresse 
de l'instruction suivante à exécuter, le calculateur recom- 


mence alors les différentes étapes pour l'instruction sui- : 


vante, et le programme se déroule ainsi. Il est seulement © 


nécessaire de charger l'adresse de démarrage dans le 


compteur ordinal, avant de lancer l'exécution du pro- : 


gramme ; ensuite tout se déroule sans autre intervention. 
Le processus décrit ci-dessus n'est en fait que le processus 
de base. || peut s'ajouter un certain nombre d'étapes inter- 
médiaires. Celles-ci dépendent de la structure détaillée 
de l'unité centrale et du type d'instruction rencontré. 
Adressage indirect 

Au lieu de spécifier dans l'instruction l'adresse de l'opé- 
rande, on indique l'adresse d'un mot contenant l'adresse 
de l'opérande. Ce procédé est employé lorsqu'on ne 
peut pas connaître a priori l'adresse de l'opérande; il 
est utilisé, par exemple, pour les transferts d'information 
à des sous-programmes. La seule information qu'un sous- 
programme reçoit est l'adresse de retour, qui lui est 
transmise au moment de l'appel. Si les informations dont 
il a besoin ont été placées dans des mots ayant des posi- 
tions définies par rapport à l'adresse de retour, le sous- 
programme peut calculer les adresses où trouver ses 
arguments et aller les chercher par adressage indirect. A 
l'exécution d'un adressage indirect, il y a un cycle mémoire 
supplémentaire, le contenu du mot adressé dans l'ins- 
truction étant transféré dans le R.I. à la place de l'adresse 
qui y figurait, avant la phase d'exécution (fig. 29). 
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Indexage 

Certaines machines sont pourvues de registres d'index. 
Lorsqu'une instruction indexée est décodée, le contenu 
du registre d'index est ajouté à l'adresse figurant dans l'ins- 
truction. On peut ainsi, à partir d'une seule adresse, 
accéder à plusieurs mots mémoire en faisant varier le 
contenu du registre d'index. Ce procédé est très utile lors- 
qu'on a à traiter des informations contenues dans des 
tables (une table est constituée de plusieurs mots succes- 
sifs contenant des informations de même type). On peut 
en effet explorer toute la table en n'utilisant que la pre- 
mière adresse (fig. 30). 


D'après la façon dont se déroulent les opérations, nous 
pouvons voir qu'il n'y a aucune différence de nature entre 
les instructions et les données. Tout est en mémoire. Les 
informations représentant des instructions doivent seu- 
lement être structurées correctement, pour éviter que des 
données ne soient transférées dans le registre d'instruc- 
tions et interprétées comme des instructions, Cela peut se 
produire, par exemple, lorsqu'en rédigeant un programme 
on fait une erreur dans un calcul d'adresse se traduisant 
par un branchement à une mauvaise adresse. De plus, 
il est possible, pour le programme, de déplacer ou modifier 
certaines de ses instructions. En effet, celles-ci étant en 
mémoire, peuvent être transférées dans l'U.A.L. pour y être 
traitées tout comme des données, puis remises en mémoire. 


Les entrées-sorties 


Le calculateur doit échanger des informations avec le 
monde extérieur (chargement des programmes, lecture des 
données, sortie de résultats). Pour cela il est muni d'unités 
d'entrées-sorties (fig. 31). 


< Figure 28 : instruction 
de branchement; 

la partie adresse 

de l'instruction est 
transférée dans C.O. 

à la place du contenu 
précédent. 


< Figure 30 : 
instruction avec adressage 
indexé. 


Y À gauche, figure 29 : 
instruction comportant 
une lecture avec adressage 
indirect. 

A droite, figure 31 : 
structure générale 

des calculateurs 
électroniques. 


|) Echanges d'information 


cm) Signaux de commande 


Contrôleur 


d'accès direct 


Mémoire 
centrale 


Périphériques 
en accès direct 
mémoire 
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programmé 


Selenia 


À Console 
du calculateur 
Selenia GP-16. 


Y A gauche, 

système GE-115 à cartes 
(General Electric) : 

la carte perforée 
représente l'unique support 
pour l'introduction, 

la mémoire et le traitement 
des données de ce système. 
A droite, 

détail d'une imprimante 
reliée aux systèmes 
électroniques. 


La console du calculateur 

La console est directement associée à l'unité centrale. 
Elle permet de commander manuellement certaines opéra- 
tions qui, ordinairement, se déroulent de façon interne. 
Elle comporte deux types d'éléments : 

— Des interrupteurs (ou clés), poussoirs, etc., per- 
mettant de coder des informations binaires, de les charger 
en mémoire ou dans certains registres, de provoquer des 
opérations élémentaires en déclenchant certains cycles 
au niveau de l'unité de commande. 

— Des voyants lumineux permettant de visualiser les 
contenus de mots mémoire, de registres et l'état de l'unité 
centrale. 

Elle permet donc, en principe, d'utiliser le calculateur, 
en chargeant programmes et données manuellement et en 
regardant les résultats directement en mémoire. Il est évi- 
dent qu'une telle méthode n'est pas très efficace. Elle est 
employée uniquement pour vérifier des points de détail 
dans le fonctionnement du calculateur ou dans le dérou- 
lement d'un programme. 

Les périphériques 

Les périphériques sont des organes d'entrées-sorties, 
plus ou moins spécialisés, permettant des communications 
plus rapides et sous des formes plus appropriées que la 
console du calculateur. Leur fonction consiste à transposer 
une représentation des informations interne au calculateur 
(donc binaire) en d'autres représentations, sur des 
supports physiques variés ou vice versa. Il existe diffé- 
rents types de périphériques, cependant les échanges avec 
l'unité centrale se font pratiquement toujours selon les 
mêmes principes. Ces échanges peuvent se faire de deux 
façons : 
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— Échanges programmés : c'est l'unité centrale qui 
gère et commande toutes les opérations par son unité de 
contrôle. Toutes les opérations doivent donc figurer 
explicitement dans le programme. 

— Échanges en accès direct : certains périphériques 
sont munis de circuits de commandes indépendants, et 
peuvent accéder par eux-mêmes à la mémoire centrale. 
Dans ce cas, le rôle de l'unité centrale consiste à initialiser 
le contrôleur du périphérique qui prend en charge le détail 
des opérations. De cette façon, l'unité centrale peut effec- 
tuer un travail interne pendant que le périphérique effectue 
ses transferts. 

En plus des informations lues ou écrites, l'U.C. et le 
périphérique échangent des informations de contrôle. 
L'U.C. envoie des commandes et peut tester l'état du 
périphérique. En effet, les périphériques, comportant pres- 
que toujours des organes mécaniques, sont beaucoup 
plus lents que l'U.C. Celle-ci doit donc attendre que le 
périphérique ait terminé une action avant d'envoyer une 
nouvelle commande. 

Il existe plusieurs types de périphériques, correspon- 
dant à différents besoins. 


Communication directe homme-machine 


— Clavier alphanumérique : semblable à un clavier de 
machine à écrire, il transmet au calculateur les codes 
correspondant aux touches frappées. 

— Téléimprimante : elle imprime sur papier les caractères 
d'imprimerie correspondant aux codes transmis par le 
calculateur. 

— Écrans de visualisation à rayons cathodiques : en 
affichant des points lumineux à des positions correspon- 
dant aux valeurs transmises par le calculateur, ils permet- 
tent de représenter soit des dessins, soit des caractères 
(donc des textes). 

On trouve très souvent associés un clavier et une télé- 
imprimante où un écran. Cette combinaison permet le dia- 
logue entre un opérateur, qui transmet des informations 
par le clavier, et un programme qui transmet des informa- 
tions par l'écran ou la téléimprimante. Ce dialogue ne 
peut avoir lieu que sous la forme prévue dans le pro- 
gramme. Les programmes d'entrées-sorties comportent 
toujours des tests sur la nature de l'information qu'ils 
reçoivent. Par exemple, si l'opérateur doit entrer un 
nombre, et qu'il frappe un caractère non numérique 
(il arrive qu'on frappe la lettre O à la place du chiffre zéro), 
le programme ne doit pas en tenir compte, et recommen- 
cer la séquence de lecture. 


Entrées-sorties sur cartes ou rubans perforés 


On utilise beaucoup les cartes ou les rubans perforés, 
lorsqu'un dialogue n'est pas nécessaire entre l'utilisateur 
et le calculateur. Cartes ou rubans peuvent être perforés 
sur une perforatrice indépendante du calculateur, et lus 
en bloc par un lecteur connecté au calculateur. 


On peut éventuellement faire perforer des résultats 
si on veut les réutiliser comme données pour d'autres 
programmes. 

Imprimantes rapides 

Très souvent, les résultats d'un programme doivent 
simplement être imprimés. Les imprimantes rapides impri- 
ment une ligne à la fois, contrairement aux téléimpri- 
mantes, associées à un clavier, qui impriment caractère 
par caractère. 

Traceurs de courbes 

Ils permettent de dessiner des figures, en commandant 
les déplacements d'une plume sur un papier. 
Mémoires de masse 

Pour stocker de grandes quantités d'informations on 
utilise des unités : 

à bande magnétique, 
à disque magnétique, 
à tambour magnétique, 
à feuillets magnétiques. 

Ces périphériques ne sont pas destinés à la communi- 
cation directe ou indirecte homme-machine. Ils permettent 
le stockage d'informations avec les avantages suivants : 

— La même unité permet lecture et écriture sur le 
même support. 

— Ils permettent d'accéder à toute l'information qu'ils 
contiennent, quel que soit l'ordre des opérations de lec- 
ture ou écriture qu'on veut effectuer. 

— Ils ont des capacités élevées. 

— Ils présentent des vitesses de transfert avec l'U.C. 
très élevées. 

Périphériques spéciaux 

Des équipements automatiques de mesure de grandeurs 
physiques (pressions, températures, tensions électri- 
ques, etc.) peuvent être connectés à un calculateur. Ainsi 
le calculateur peut enregistrer et surveiller ce qui se passe, 
par exemple dans une installation industrielle ou expéri- 
mentale. De même le calculateur peut être connecté à 
des organes de télécommande et commander lui-même 
ces installations. 


Écriture et manipulation 
des programmes 


Dans ce qui précède nous avons toujours considéré 
des cas d'exécution de programmes supposés en mémoire, 
sans préciser la manière de les y faire parvenir. Le pro- 
gramme, tel qu'il se présente en mémoire lors de l'exécu- 
tion, est sous forme binaire, en langage machine. On 
peut envisager d'écrire ce programme directement en 
binaire, et de le charger en mémoire à l'aide des clés de 
la console. C'est, apparemment, la méthode la plus directe, 
elle présente cependant de graves inconvénients : 

— les risques d'erreurs sont importants à l'écriture du 
programme, la relecture en est difficile; 


— l'introduction manuelle présente d'autant plus de 
risques de fausses manœuvres que le programme est plus 
long; l'opération est lente et immobilise le calculateur 
pendant toute sa durée. 

L'emploi de cette méthode ne peut donc pas être géné- 
ralisé, cependant nous verrons quelques cas où cela peut 
être utile. Nous voyons que l'utilisation pratique d'un 
calculateur pose deux types de problème : — l'écriture 
des programmes, et — la manipulation des programmes 
(chargement). Pour faciliter ces opérations, on a recours 
à un ensemble de programmes spécialisés; nous allons 
voir comment. 


L'écriture des programmes 


Le nombre des opérations élémentaires que peut réa- 
liser un calculateur, peut être plus ou moins grand, selon 
le type de machine, mais c'est toujours un nombre fini, 
allant de quelques instructions à quelques dizaines en ce 
qui concerne les instructions courantes. || est alors plus 
pratique d'utiliser des symboles, plus proches de la signi- 
fication de l'opération, que des codes purement numé- 
riques, sans rapport avec l'opération et donc plus difficiles 
à retenir et à ne pas confondre. Par exemple, on peut 
convenir de représenter l'addition par le symbole ADD, 
la division par DIV, le branchement inconditionnel par 
JMP (en anglais jump = saut), etc. De même, on peut 
utiliser des symboles pour repérer des informations 
(nombres ou instructions) à l'intérieur même du pro- 
gramme, par exemple appeler X, Y, ou Z (ou de toute autre 
facon) des adresses dans le programme auxquelles on a 
besoin de faire référence. Ceci est à rapprocher de l'uti- 
lisation, en mathématiques, de lettres pour représenter les 
nombres, avec cependant la distinction importante qu'en 
informatique on représente les adresses et non les conte- 
nus. 

Ainsi, l'instruction ADD X signifie : ajouter au contenu 
actuel de l’accumulateur le contenu du mot mémoire 
d'adresse X, et non la valeur X qui, elle, est une adresse. 
L'avantage d'une telle notation est qu'elle permet de 
faire référence, lors de l'écriture d'un programme, à des 
informations sans avoir besoin de connaître explicite- 
ment leur adresse. La valeur exacte de l'adresse ne sera 
en effet déterminée que plus tard, mais dans tout le pro- 
gramme, un même symbole représente toujours une seule 
adresse (ou une seule opération s'il s'agit d'un code 
opération). 
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À Unité à disques 
magnétiques ; /e disque 
présente par rapport 

au ruban le grand avantage 
de permettre un traitement 
non séquentiel des données. 


« Détail d'une mémoire 
à ruban. 


General Electric 


Considérons l'exemple très simple suivant. On veut 


ajouter un nombre à un autre nombre; on dispose des 
opérations suivantes : 


— chargement de l’accumulateur symbolisé par: CHA 
— addition au contenu de l'accu. » » ADD 
— rangement du contenu de l'accu. »  _» RCA 
— arrêt du programme » _» HLT 


Il faut également disposer d'un moyen de réserver des 
mots mémoire pour les nombres à additionner; supposons 
qu'on utilise le symbole DC suivi d'une constante. Le 
programme peut alors s'écrire ainsi : 


CHA X chargement du contenu de X dans l'accu. 
ADD Y addition du contenu de YŸ 

RCA Y rangement du résultat dans Y 

HLT arrêt 
X/DC 25 définition des adresses X et YŸ et de leur 
Y/DC 7 contenu initial 


Nous voyons les symboles X et Y apparaître plusieurs 
fois de façon différente : — dans les instructions elles- 
mêmes, comme partie adresse de l'instruction et — comme 
définition d'adresse précédant le symbole DC. Chaque 
symbole peut apparaître autant de fois que cela est néces- 
saire comme partie adresse d'instruction mais doit appa- 
raître une fois et une seule, comme définition d'adresse. 
Ainsi, si la première instruction du programme occupe 
l'adresse 0, et si chaque instruction occupe un mot, 
X représente l'adresse 4, Y l'adresse 5. Après l'exécution 
de ce programme, le contenu de X n'aura pas changé; 
celui de Ÿ sera remplacé par la somme des deux nombres, 
soit 32. 

Supposons qu'on veuille réécrire ce programme de telle 
façon que les contenus des adresses X et Ÿ ne soient pas 
modifiés en cours d'exécution. Il faut alors définir une 
autre adresse où l’on rangera le résultat. Le programme 
s'écrit alors ainsi : 


CHA X 
ADD Y 
RCA Z 
HLT 
X/DC 25 
Y/DC 7 
Z/DC O0 


Après exécution, le résultat se trouvera à l'adresse Z. 
Les contenus de X et Ÿ auraient aussi pu être des résultats 
de calculs préalables; dans ce cas la valeur numérique 
définie dans le programme est sans importance, mais il 
faudrait que la partie du programme calculant ces valeurs 
les range aux adresses correspondantes, au moyen d'ins- 
tructions RCA X et RCA Y. Il faut remarquer la présence 
de l'instruction HLT à la fin du calcul; en effet, sans cette 
instruction, le calculateur continuerait à prendre pour des 
instructions le contenu des adresses suivantes, ce qui a 
des conséquences imprévisibles mais souvent désas- 
treuses dans un programme (destruction du programme en 
mémoire, par exemple). 

Nous disposons ainsi d'une méthode pour écrire des 
programmes, d'une façon plus claire et plus pratique qu'en 
langage machine binaire, grâce à la possibilité d'utiliser 
des symboles. Cependant le programme doit être en binaire, 
au moment de le faire exécuter par le calculateur. 


Traduction en langage machine 


La traduction du programme symbolique en programme 
binaire est effectuée par un programme généralement 
appelé assembleur. Le travail de ce programme consiste 
essentiellement en deux points : 

— Répertorier tous les symboles définissant des 
adresses dans le programme. Pour cela, l'assembleur lit 
une à une les instructions, en les comptant (nous suppo- 
serons pour simplifier qu'une instruction occupe toujours 
un mot mémoire). Chaque fois qu'il rencontre un symbole 
définissant une adresse il range ce symbole dans une 
table avec la valeur correspondante du comptage c'est-à- 
dire l'adresse. 

— Remplacer, dans chaque instruction, le code opé- 
ration symbolique par le code binaire correspondant. Les 
codes opérations sont obtenus à partir d'une table per- 
manente, faisant partie de l'assembleur. Les adresses sont 
obtenues à partir de la table qui a été préalablement cons- 
tituée. Les codes ainsi obtenus (opération et adresse) 
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sont assemblés de facon à constituer une instruction 
machine. 

L'assembleur, lorsqu'il effectue la traduction, occupe 
une partie de la mémoire du calculateur. D'autre part, 
les adresses ne sont pas toujours affectées définitivement 
à l'assemblage. En effet, s'il est toujours possible de défi- 
nir une adresse à l'intérieur d'un programme, en convenant 
d'appeler adresse 9 l'adresse du premier mot occupé par 
le programme, on ne peut pas toujours choisir a priori 
l'adresse effective en mémoire à partir de laquelle on 
chargera le programme, pour le faire exécuter. Pour cer- 
tains types de tâches, on utilise plusieurs programmes 
qui doivent résider simultanément en mémoire; selon 
les besoins, ces programmes n'occuperont pas toujours 
les mêmes parties de la mémoire. De plus, l'assemblage 
d'un programme, surtout si ce programme est important, 
est une opération qui demande de la place en mémoire, 
et du temps de traitement. Il est alors plus rentable et plus 
commode de ne faire l'assemblage qu'une seule fois, et 
de disposer ensuite d'un programme binaire. Le programme 
binaire assemblé n'est donc pas directement chargé en 
mémoire centrale, mais est stocké par exemple sur bande 
ou disque magnétique, ou sur ruban perforé. 


Chargement 


Un programme ayant été traduit en binaire doit être 
chargé en mémoire centrale, pour être exécuté. On utilise 
pour cela un autre programme, appelé généralement 
chargeur. La nature des opérations effectuées par le 
chargeur dépend de deux choses. 

— La facon dont se fait l'adressage dans l'unité 
centrale, au cours de l'exécution. Si l'adressage est fait 
par adresses, chaque instruction doit contenir l'adresse 
effective de l'opérande, qui peut dépendre de l'adresse 
initiale de chargement. Si l'adressage se fait par base et 
déplacement, toutes les adresses sont relatives, par rapport 
à une adresse de base définie dans le programme, et qui 
sera chargée dans le registre de base au début de l'exé- 
cution. Ces adresses relatives sont indépendantes du 
point de chargement. 

— Le type de code binaire généré par l'assembleur, 
dans le cas de l’adressage par adresses. Si l'adresse de 
chargement a été choisie à l'écriture du programme, l'as- 
sembleur génère directement les adresses effectives. On 
dit qu'il s'agit d’un assembleur donnant un code binaire 
absolu. Le programme ainsi assemblé devra obligatoire- 
ment être chargé à l'adresse prévue. Par contre, si l'adresse 
de chargement doit rester au choix de l'utilisateur, l'assem- 
bleur ne peut pas générer les adresses effectives. 

Ainsi dans l'exemple précédent, X représente l'adresse 
4 dans le programme, mais si on choisit de le charger à 
partir de l'adresse 1596, X devra représenter l'adresse 1 5ÿ4 
en mémoire. Selon les cas, le chargeur recopiera simple- 
ment en mémoire le code binaire, tel qu'il l'aura lu, ou 
bien calculera les adresses effectives, en ajoutant aux 
adresses définies dans le programme l'adresse de char- 
gement, avant de mettre en place le code binaire. Dans 
ce dernier cas, le chargeur doit pouvoir faire la distinc- 
tion, dans le code binaire généré par l'assembleur, 
entre les mots contenant des références mémoire, par 
exemple des instructions avec opérandes ou des poin- 
teurs contenant des adresses, et qui doivent donc être 
modifiés en fonction de l'adresse de chargement, et 
d'autre part les mots contenant des constantes ou des ins- 
tructions ne faisant pas appel à la mémoire et qui sont 
donc indépendants de l'adresse de chargement. Pour ce 
faire, l'assembleur « marque » chaque mot du pro- 
gramme différemment, selon qu'il devra ou non être modi- 
fié au chargement. Le chargeur ne modifie alors que les 
mots concernés. 

Au moment du chargement, le chargeur occupe lui- 
même une partie de la mémoire. Il est donc impossible 
qu'un programme soit chargé à cet endroit, cependant on 
peut généralement utiliser cette place, par exemple pour 
stocker des données qui seront lues par le programme, 
le chargeur étant alors « écrasé ». 

On se trouve apparemment dans un cercle vicieux : 
pour écrire et charger un programme, il faut disposer 
d'autres programmes. Ces programmes, comment les 
écrire et les charger? Remarquons d'abord qu'il suffit 
d'obtenir au moins une fois ces deux programmes en 
binaire. On peut ensuite en faire autant de copies que 
l'on désire. Pour cette raison, ces programmes sont géné- 


ralement réalisés par le constructeur de la machine et 
vendus en même temps. Le problème se réduit donc, 
pour le constructeur, à faire un assembleur et un chargeur, 
lorsqu'il fabrique un nouveau modèle. En général, on 
utilise pour cela un autre calculateur, avec un programme 
qui «simule » un assembleur, et qui produit les programmes 
binaires, par exemple sur ruban perforé. 


Utilisation d'un calculateur 


Le problème pratique qui se pose à l'utilisateur est la 
mise en œuvre du calculateur. Celle-ci dépend de la confi- 
guration physique de l'ensemble, en particulier des péri- 
phériques disponibles et de la capacité mémoire. Pour 
exécuter un programme, les opérations successives sont : 

— Rédaction du programme et préparation du pro- 
gramme source (ruban perforé par exemple). 

— Chargement et exécution de l’assembleur pour 
traduire le programme en binaire. 

— Chargement et exécution du programme propre- 
ment dit. 

Les opérations concernant directement le calculateur 
sont donc essentiellement le chargement et le démarrage 
des programmes. Elles peuvent être réalisées manuelle- 
ment, en introduisant en mémoire, à l'aide des clés de la 
console un programme de chargement. En général, il 
s'agit d'un programme très court, destiné à lire un char- 
geur plus performant. Le démarrage s'effectue en char- 
geant de la même façon l'adresse de départ du programme. 
Ces opérations doivent être répétées pour chaque pro- 
gramme, il y a donc intérêt à les rendre automatiques. 


Notion de système d'’exploïtation 


L'adjonction au calculateur d'une mémoire de masse 
périphérique (par exemple une unité de disque magné- 
tique) et l’utilisation de certains programmes ad hoc per- 
mettent de simplifier la tâche de l'utilisateur. 

Pour cela, on réserve une partie de la mémoire centrale 
pour un programme appelé moniteur où superviseur; ce 
programme est destiné à gérer l'ensemble des tâches en 
faisant tout ce qui ne nécessite pas une intervention par- 
ticulière de l'utilisateur. Une partie du disque est également 
réservée au moniteur pour ses besoins propres, une autre 
partie comporte les programmes évoqués ci-dessus; le 
reste de la place est à la disposition des utilisateurs. 

Le moniteur comporte plusieurs parties, assurant cha- 
cune certaines fonctions : 

— communications avec les utilisateurs, par exemple 
par l'intermédiaire d'un télétype; 

— décodage des informations fournies par l'opé- 
rateur; 

— échanges entre unité centrale et périphériques. 

Les informations enregistrées sur le disque sont grou- 
pées en fichiers. Un fichier est un ensemble structuré 
d'enregistrements, repéré par un nom grâce auquel le 
moniteur peut le localiser et l'utiliser. Certaines parties 
du moniteur sont résidentes, c'est-à-dire toujours pré- 
sentes en mémoire centrale; les autres parties sont char- 
gées uniquement en cas de besoin, et les parties de la 
mémoire utilisées sont de nouveau disponibles après. Ce 
procédé permet de ne réserver qu'une petite partie de la 
mémoire centrale au moniteur, le reste étant à la disposi- 
tion des utilisateurs. 

L'utilisateur dispose alors de commandes ou instruc- 
tions de contrôle pour indiquer au moniteur les tâches à 
exécuter. Ces commandes sont passées soit par le clavier, 
soit encore par des cartes perforées, comportant un code 
spécial les identifiant comme cartes de contrôle. 

Le démarrage proprement dit du calculateur consiste à 
charger manuellement un programme court (appelé 
boostrap) destiné à lire un programme d'initialisation. 
Ce programme charge la partie résidente du moniteur 
et lui passe le contrôle. Le moniteur est alors prêt à rece- 
voir des commandes. Après cela il n‘y a, en principe, plus 
d'opération à effectuer manuellement à la console, tout 
se déroulant sous le contrôle du moniteur. 

A titre d'exemple, voici, de façon pratique, comment se 
déroule un travail sur un gros calculateur. 

— On écrit le programme. Très souvent on utilise un 
langage de programmation plus évolué que le langage 
d'assemblage (voir plus loin). | 

— On perfore le programme sur cartes. 

— On ajoute les cartes de contrôle donnant au 


JKKKKKXXFKEX PROGRAMME "MAX"! 


JEKEXXEXXX PROGRAMME "'MAX'' 
F2 HKKERFEREREREEZ 
7 


PAL8-V9B NO/DA/TE PAGE ! 


/CE PROGRAMME CHERCHE L'ADRESSE ET LA VALEUR DU PLUS GRAND 
ZNOMBRE CONTENU DANS UNE TABLE DE 64 MOTS MEMOIRE» SITUEE 
/A PARTIR DE L'ADRESSE: TAB . LES NOMBRES SONT DES ENTIERS 


/POSITIFS» 


/L8 VALEUR DU MAXIMUM EST RANGEE À L'ADRESSE : MAX 
/L'ADRESSE DU MAXIMUM EST RANGEE A L'ADRESSE : ADMAX 
ZEN FIN DE TRAITEMENT LE PROGRAMME S'ARRETE 


/ 
0200 x206 

00200 7300 CLA CLL 
00201 1227 TAD INPTR 
00202 3230 DCA PTR 
00203 7001 TAC 
00204 3231 DCA MAX 
00205 3232 DCA ADMAX 
00206 1233 TAD LONG 
00207 3234 DCA CNTR 
OC210. 7100 ENCORE, CELL 
00211 1231 TAD MAX 
00212 7041 CIA 
00213 1630 TAD I PTR 
09214 7630 SZL CLA 
00215 5222 JMP UPDATE 
00216 2230 INCR; ISZ PTR 
00217 2234 1SZ CNTR 
00220 5210 UMP ENCORE 
00221 7402 HET 
00222 1230 UPDATE» TAD PTR 
00223 3232 = DCA ADMAX 
00224 1630 TAD I PTR 
00225 3231 DCA MAX 
00226 5216 JUMP INCR 
00227 0235 INPTR; TAB 
00230: 0000 PTR» (e) 
00231 0000 MAX» Le) 
00232 0000 ADMAXr © 
00233 7700 LONG: -100 
00234 0000 CNTR;0 
00235 0000 TAB ZBLOCK 100 

$ 


moniteur toutes les indications concernant le travail 
(langage utilisé, exécution ou seulement traduction en 
langage machine, etc.). 

— On place le tout dans le lecteur de cartes. 

Le reste des opérations jusqu'à la sortie des résultats 
s'effectue sans autre intervention de l'utilisateur. Le moni- 
teur et les autres programmes utilisés pour la réalisation 
d'un programme d'utilisateur constituent le système 
d'exploitation. 

L'utilisation d'un système d'exploitation est nécessaire, 
car l'automatisation de beaucoup d'opérations, d'une part, 
réduit considérablement les risques d'erreurs, d'autre part, 
accélère le rendement de la machine par la suppression 
des interventions humaines, très lentes en comparaison 
de la vitesse du calculateur. Par ailleurs, elle facilite le 
travail des utilisateurs en les déchargeant de nombreuses 
opérations répétitives et fastidieuses. 

Les gros calculateurs sont généralement dotés de sys- 
tèmes puissants, permettant de gérer en même temps les 
travaux de plusieurs utilisateurs. Pour ces machines, il 
importe que le système soit performant, car il utilise lui- 
même une partie des ressources de l'ensemble (place en 
mémoire, temps d'unité centrale) et le coût d'exploitation 
de ces calculateurs est très élevé. On peut définir des 
critères de qualité, par exemple : 


Rt — Rendement en temps d'unité centrale 

Rm — Rendement en ressources mémoire 

Rt= Temps d'exécution des travaux d'utilisateur 
Temps total de travail 

Place mémoire disponible pour l'utilisateur 


Place mémoire totale disponible 


Rm 


Un bon système d'exploitation doit offrir beaucoup de 
facilités aux utilisateurs, tout en ayant le meilleur rende- 
ment possible. 

Il faut remarquer un point important : pour le calcula- 
teur, les programmes du système d'exploitation sont des 
programmes comme les autres. Le fonctionnement phy- 
sique du calculateur ne dépend pas du programme en cours 
d'exécution. Par contre, pour l'utilisateur, ces programmes 
sont « transparents » car il les utilise en permanence, sans 
avoir à les connaître en détail. Le calculateur et le système 
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A Exemple de programme 
assemblé. Ce programme 
a été écrit pour 

un calculateur PDP 8|/E 

de Digital Equipment, 

et assemblé avec 
l'assembleur PAL 8. 

La liste du programme 

est imprimée 

par l'assembleur. 

Elle comporte 

cinq colonnes : 

1. les adresses (en octal); 
2. le contenu des mots 
mémoire correspondants 
(en octal); 

3. les définitions 
d'adresses symboliques 
(par exemple, MAX 
représente l'adresse 231); 
4. le code opération 
symbolique ou le contenu 
du mot; 

5. l'adresse de l'opérande 
pour les instructions 
contenant une référence 
à une adresse. 

Tout ce qui est précédé 
du signe / constitue 

des commentaires et n'est 
pas pris en compte au cours 
de l'assemblage. 


A Le graphisme 

par ordinateur offre 

des possibilités multiples : 
ici, tracé obtenu 

par intégration numérique 
d'un système d'équations 
différentielles. 


d'exploitation constituent Un ensemble de ressources que 
l'utilisateur emploie pour ses besoins propres, à savoir 
l'exécution de ses programmes. 


Les langages évolués 


Nous avons vu que la programmation en langage 
machine, même symbolique, était affaire de spécialiste, 
car elle demande une bonne connaissance de la structure 
et du fonctionnement détaillé de la machine. De plus, un 
programme écrit pour un modèle de calculateur est inuti- 
lisable sur un autre modèle. Pour ces raisons, on a créé 
des langages de programmation plus évolués, ayant un 
formalisme plus en rapport avec les problèmes traités, 
et surtout indépendants dans leur syntaxe du type de 
machine utilisée, mettant ainsi la programmation à la 
portée de beaucoup plus de gens et d’une façon relati- 
vement facile. 

Le premier langage évolué a été créé en 1956. Il 
s'agit de FORTRAN (FORmula TRANslator). Ce langage 
utilise des notations très semblables aux notations mathé- 
matiques habituelles. Il est très utilisé dans les disciplines 
scientifiques, car il est surtout orienté vers les calculs. 

ALGOL : plus évolué que Fortran, donc plus per- 
formant, il est cependant peu utilisé avec les calculateurs. 
Il est utilisé comme moyen de communication entre 
mathématiciens pour décrire des algorithmes. 

COBOL : langage orienté vers les travaux de gestion, 
il n'est pas destiné à faire des calculs très compliqués, 
mais est très développé du point de vue des entrées- 
sorties et de la gestion de fichiers de données. 

PL1 : langage universel, permettant aussi bien les 
calculs importants que la gestion. Créé en 1970, il est 
encore moins utilisé que Fortran ou Cobol. 

Un langage évolué utilise des symboles et des opéra- 
teurs. Ces opérateurs représentent des opérations abs- 
traites, et non les opérations qu'il faut faire exécuter 
concrètement au calculateur. Ainsi, par exemple, l'ins- 
truction WRITE en Fortran est une instruction de sortie, 
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mais demande en réalité des centaines d'instructions 
machine. 

Pour chaque langage et chaque type de calculateur, 
il faut un procédé de traduction en langage machine. 
La traduction est faite par un programme spécifique au 
calculateur utilisé; ce programme est appelé compilateur, 
son travail comporte deux parties. 

— Pour chaque instruction du langage considéré, 
décomposer l'opération en une suite d'opérations élé- 
mentaires exécutables par la machine. C'est une tâche 
comparable à ce que fait un programmeur qui prépare 
un programme en langage machine symbolique. 

— Générer le code binaire correspondant aux 
séquences ainsi créées. Il s'agit en fait d'assembler le 
programme. || se trouve souvent que l'assembleur utilisé 
sur un calculateur soit une partie d'un compilateur. 

Chaque langage possède des règles d'écritures pour 
que chaque instruction puisse être analysée correctement 
et conformément au désir du programmeur. Le résultat 
de cette analyse par le compilateur doit d'une part repré- 
senter l'instruction initiale, d'autre part correspondre à la 
réalité physique du calculateur. En d'autres termes, l'ana- 
lyse doit aboutir à une description finale du programme 
uniquement à l'aide d'éléments du langage machine. 


Emploi des ordinateurs 


Comme moyen de calcul 

L'emploi des ordinateurs comme moyen de calcul per- 
met d'aborder et de résoudre des problèmes, en particulier 
dans les disciplines scientifiques, qui seraient quasiment 
impossibles à traiter autrement. En effet certains problèmes 
n'ont pas de solution analytique connue et ne peuvent 
être traités que par des méthodes d'approximation numé- 
rique. D'autre part, la solution analytique de certains pro- 
blèmes, connue sur le plan théorique, demanderait le 
travail de plusieurs générations de mathématiciens à cause 
de la complexité des calculs, de leur longueur ou de la 
masse de données à traiter. 


Gestion 

En général, les problèmes de gestion ne demandent pas 
des calculs d'une grande complexité mathématique. 
Cependant, ils portent sur de grandes quantités de don- 
nées. Les ordinateurs permettent de tenir à jour et d'exploi- 
ter efficacement et rapidement des masses énormes de 
données (gestion de stocks, comptabilité, banques de 
données, etc.). 


Temps réel 

Dans les applications précédentes, le calculateur est 
employé de façon isolée. Il peut aussi être intégré à un 
ensemble plus vaste. Il s’agit des applications dites « en 
temps réel ». Le calculateur est connecté à des organes de 
mesure ou de surveillance pour acquérir des données, 
les trier, les stocker, en traiter une partie en temps réel, 
c'est-à-dire au rythme des phénomènes physiques étudiés. 
Il peut, en fonction des résultats trouvés, agir sur des 
organes de commande. Un exemple d'application est la 
conduite automatique de processus industriel, où le 
calculateur pilote et surveille une installation de produc- 
tion sans intervention humaine directe, sauf situation 
exceptionnelle (panne, entretien, modifications de la 
production). 
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MATHÉMATIQUES FINANCIÈRES 


Le système monétaire est né le jour où les hommes ont 
privilégié un bien particulier (l'or ou n'importe quel métal 
précieux) dont les propriétés (rareté, sécabilité, bril- 
lance, etc.) étaient telles qu'il constituait un instrument 
universellement admis pour mesurer la valeur des autres 
biens et régler alors les échanges commerciaux. La mon- 
naie était ainsi un bien semblable aux autres biens mais 
dont la valeur d'usage était augmentée d'une va/eur 
d'échange reflétant la facilité offerte à son détenteur 
d'acquérir d’autres biens. Avec le développement des 
échanges commerciaux à partir du Moyen Age, on a vu 
cette valeur d'échange prendre une importance crois- 
sante au détriment de la valeur d'usage. Cette évolution 
s'est très nettement accentuée depuis la révolution indus- 
trielle du XIX® siècle qui a suscité l'organisation du sys- 
tème du crédit et l'apparition de structures bancaires et 
financières très puissantes. La monnaie est dès lors deve- 
nue l’objet de transactions sans que celles-ci soient liées 
à la contrepartie en or qui la définissait originellement : 
elles sont liées désormais à sa valeur d'échange, c'est-à- 
dire aux possibilités de consommation et d'investissement 
qu'elle permet. 

Ces transactions s’établissent entre des prêteurs (ban- 
ques, compagnies d'assurances, État, particuliers) et des 
emprunteurs (entreprises, banques, particuliers, etc.). Le 
prêteur est rémunéré selon des modalités admises par 
tous les intervenants. Ces modalités sont fixées par des 
règles de calcul très précises dont nous verrons qu'elles 
reflètent exactement la loi de l'offre et de la demande sur 
le marché des capitaux. 

En rétribution du service rendu, l'emprunteur verse 
donc au prêteur une certaine somme, appelée intérêt 
et qui n'est autre que le loyer de l'argent prêté. L'intérêt 
est bien sûr proportionnel au montant du prêt. Mais son 
calcul est différent suivant sa durée. À cet égard nous 
distinguerons les opérations financières à court terme 


(intérêt simple) des opérations à long terme (intérêt 
composé). 


Opérations financières à court terme - 
Intérêt simple 

On appelle opérations à court terme les prêts et les 
emprunts dont la durée n'excède pas l’année. 

Le taux d'intérêt est l'intérêt qui rémunère le prêt 
de 1 F pendant un an; il s’agit donc d'un taux annuel que 
l'on notera j. Il est le plus souvent représenté par un 
pourcentage (10,33 %, 13 %, etc.). 

Considérons un prêt caractérisé par les éléments sui- 
vants : 


— montant du prêt : C, 
— durée du prêt : n jours (n < 360), 
— taux annuel : i. 
L'intérêt | que l’emprunteur devra verser au prêteur 


au terme de la durée du prêt est proportionnel à ces trois 
grandeurs. Il est donné par la formule : 


: in 
(1) l=:C 360 
A l'échéance, l'emprunteur devra rembourser la somme 
de C (1 & 5) 
° 360/° 
Exemple : C = 250000F /—=12 % n— 90 jours 


j — 250 000 x 12 x 90 
a 360 


La formule (1) exprime bien la proportionnalité de I 
au nombre de jours de la durée du prêt. Ceci est remar- 
quable, compte tenu des opérations financières au jour 
le jour auxquelles se livrent les grands organismes écono- 
miques et financiers, notamment sur le marché monétaire. 
Ces opérations portent sur des montants considérables 
et le report d’un jour ou deux de l'échéance d'un prêt 


= 7 500F 
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Doisneau - 


À Le marché monétaire 

est le marché de l'argent 
au jour le jour. 

Les investisseurs 
institutionnels 

(grandes banques, 
compagnies d'assurances, 
S.N.C.F., etc...) 

y interviennent pour 
équilibrer leur trésorerie. 
La Banque de France 

y joue un rôle prépondérant 
par des transactions 
journalières importantes 
qui assurent l'équilibre 

de la balance des paiements 
du pays et le soutien 

de la monnaie nationale. 


Page ci-contre, donne lieu à des coûts financiers que le gestionnaire 

: à figure 2: ou le banquier ne néglige pas. D'où l'importance des 

représentation schématique  Gélais de paiement dans les opérations commerciales 

ARBRES d'équivalence. iisque tout retard ou toute avance dans les paiements 

igure 3 : l'évaluation = de : à À 

d'unesuïite d'annuïités à des conséquences sur la rentabilité del entreprise. C est 

dépend du taux tout le problème de la gestion optimale de la trésorerie 

d'évaluation, du montant des firmes qui se trouve posé au travers de la formule (1). 

de chaque annuïté Notons que l'intérêt se paie à l'échéance du prêt, au 

et du nombre moment du remboursement, et non avant. C'est ainsi que 

de ces annuïtés.  |es opérations d'escompte sont pratiquées à l'encontre 

de cette règle puisque le banquier fait payer l'intérêt au 

début du prêt (en le déduisant du montant demandé). 

Il s'ensuit un coût financier plus élevé pour l'emprunteur. 

Y} Ci-dessous, tableau | : Autrement dit, le taux d'intérêt annoncé dans les opéra- 

valeur acquise d'un capital tions d'escompte (e) est inférieur au taux réellement 
de 1 F au bout de n années. pratiqué (é) : 

En bas, tableau II : Soit C le capital prêté à un terme de n jours. Le taux 

valeur actuelle de T1 F  d'escompte annoncé par le banquier est e. Au moment 


disponible dans n années. Qu Versement des fonds, celui-ci va verser au client non 
Ci-contre, figure 1 : ne 
voir développement pas C mais (c 


— —— C}. Au bout des n jours, le client 
dans le texte. À 360 | ] 


Tableau | - Valeur acquise d’un capital de 1 F au bout de n années 
en fonction du taux d'intérêt i 


1,092 500 1,095 000 1,097 500 1,100 000 
1,193 556 1,199 025 1,204 506 1,210 000 
1,303 960 1,312 932 1,321 946 1,464 100 
1,424 577 1,437 661 1,592 292 1,610 510 


2,535 393 2,593 742 


93,477 253 104,767 463 117,390 850 


Tableau II 
Valeur actuelle de 1 F disponible dans n années 


9,25 % 


0,915 332 0,913 242 0,911 162 0,909 091 


0,837 832 0,834 011 0,830 216 0,826 446 
0,766 895 0,761 654 0,756 461 0,751 315 
0,701 963 0,695 574 0,689 258 0,683 013 
10 0,412 844 0,403 514 0,394 416 0,385 543 


0,011 993 0,010 698 0,009 545 0,008 519 
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remboursera C. Le taux réellement pratiqué £ est donné 
par la formule : 


{c ne c) (: = c 


\ 360 360, 
: e 
Soit = —————— ; on a donce < ét. 
je 
360 


Opérations à long terme - Intérêts composés 


Considérons un prêt durant plusieurs années (5, 10, 
20 ans par exemple). Il est légitime d'admettre que l'inté- 
rêt produit au titre d'une année est ajouté au capital 
emprunté pour former un nouveau capital portant intérêt 
pendant les années suivantes. Tel est le principe de la 
règle des intérêts composés. 


Valeur acquise par un capital au bout de n années 

Soit D le montant du prêt et / le taux (annuel) auquel 
est rémunéré le prêt. Le prêteur cherche à connaître le 
montant A; qui lui reviendra lorsque le prêt lui sera rem- 
boursé, en une seule fois, à l'échéance. A, est appelée la 
valeur acquise du capital D. 

A la fin de la première année, le prêt a produit un intérêt 
s'élevant à / : D; la valeur acquise A1 est égale à D (1 + ;). 
L'intérêt est alors ajouté au capital; il devient alors pro- 
ductif d'intérêt pour l'année suivante. A la fin de la 
deuxième année, le prêt a produit un intérêt s'élevant à 
Î: A. C'est-à-dire que la valeur acquise au bout de deux 
ans est égale à A1 (1 +— i), soit D (1 + /)2. En raisonnant 
de la sorte pour les années suivantes, on montre que la 
valeur acquise A, est donnée par: 


(2) An = An-1 (1 +—i) = D (1 +)? 


Il ressort de la formule (2) que A, croît « très vite » avec 
le nombre d'années n (croissance dite « exponentielle »). 
Exemple : 1 F placé en 1926 au taux de 7 % devien- 
drait aujourd'hui (en 1976) 29,45 F (tableau 1). C'est-à- 
dire qu'un capital placé dans ces conditions aurait été 
multiplié par 30! (les effets des dévaluations successives 
de la monnaie depuis cette époque ont bien sûr largement 
corrigé cette progression...). 


Valeur actuelle d’une somme disponible dans n 
années 

La valeur actuelle d’une somme A payable dans n années 
est la somme D, qui, placée à intérêts composés pendant 
ces n années au taux /, aurait pour valeur acquise A 
(fig. 1 et tableau Il). 


Richard Colin 


D'après ce que nous venons de voir au paragraphe pré- 
cédent, nous avons: 


A 5 
= ! —n 
Dr = A (1 +i) 

Cette formule est d'une importance tout à fait essentielle 
dans le calcul économique et financier car elle permet 
de comparer et donc d'ajouter des sommes disponibles à 
des époques différentes. 

Exemple : supposons une personne placée devant 
l'alternative suivante : recevoir 950 F dans 2 ans, ou 
recevoir 1 300 F dans 5 ans. Que va-t-elle choisir, sachant 
que le taux d'intérêt en vigueur sur le marché est de 10 %? 
Pour répondre à la question, il faut calculer les valeurs 
actuelles de ces deux sommes : la valeur actuelle de 


950 1 300 
950 Fest (TT 0,10 celle de 1 300 est de (1 0,10)$ 


soit respectivement 813,50 F et 807,17 F. Le meilleur 
choix est donc le premier. 

On aurait tout aussi bien pu comparer les valeurs acqui- 
ses pour ces deux sommes au moment de la 5° année, 
ce qui revient à comparer 950 (1 + 0,10)3 et 1 300. Le 
résultat aurait été le même. 


Ainsi donc, d'une manière générale, pour comparer 
deux capitaux disponibles à des dates différentes, il suffit 
de comparer leurs valeurs (actuelles ou acquises) à une 
date identique. 


Équivalence 

Deux capitaux ou deux ensembles de capitaux sont 
équivalents à une date donnée et à un taux donné si, à 
cette date, leurs valeurs exprimées en fonction de ce taux 
sont égales. Il s'agira de valeurs acquises ou actuelles 
suivant que la date d'évaluation est antérieure ou posté- 
rieure aux dates auxquelles sont disponibles les deux 
capitaux. 

Il peut en effet arriver que, pour des raisons commerciales 
ou financières, il soit nécessaire de remplacer un capital 
ou un ensemble de capitaux par un autre capital ou un 
autre ensemble de capitaux. Pour que l'échange ne soit 
contesté par aucune des parties en présence (débiteur 
et créancier), il faut qu'il se fasse entre des capitaux équi- 
valents de manière à ce que le temps ne soit point négligé. 

Exemple : Un commerçant a contracté deux dettes 
auprès d'un même créancier : la première en 1972 d'un 
montant de 80 000 F à 8 % devant échoir en 1979, la 
seconde en 1974 d'un montant de 100 000 F à 9 % 
devant échoir en 1981. Ces deux dettes sont rembour- 
sables en une seule fois à échéance. Le commerçant 
se met d'accord aujourd'hui (1976) avec son créancier 
pour remplacer ces deux paiements par un paiement 
unique à échéance en 1980 au taux de 10 %. Quel doit 
être le montant de cette nouvelle dette (fg. 2) ? 

En 1979, la première dette vaudra 80 000 (1 — 0,08)7, 
la deuxième en 1981 vaudra 100 000 (1 — 0,09)7. Les 
valeurs actuelles en 1976 de ces deux sommes, évaluées 
au taux de 0,10 %, sont respectivement de : 


80 000 (1 +0,08} .. 100 000 (1 + 0,09) 
(T — 0,10 (1 = 0,10)° 


Le montant X cherché est égal à la somme de ces deux 
nombres : X — 96 965 + 113 336 — 201 301 F. 


Les annuités 

On appelle annuités des versements dont les échéances 
sont séparées par des intervalles égaux (en général d'une 
année). Elles sont constamment utilisées en finance, soit 
dans le remboursement d'une dette, soit dans la constitu- 
tion d'un capital; il importe donc de pouvoir évaluer une 
suite d'annuités. Cette évaluation va dépendre du taux 
d'évaluation, du montant de chaque annuité et du nombre 
de ces annuités. 

Considérons donc une séquence de n annuités d'un 
montant 41, 42, …, 8x, …, an. Par convention, on posera que 
l'annuité 4x échoit à la fin de l'année k (fig. 3). 

L'évaluation d'une telle suite est une application du 
principe d'équivalence que nous avons présenté. A la 
date O, la valeur Vo de cette suite est égale à la somme des 
valeurs actuelles des annuités ax; (on parle de somme 
actualisée). 


Vo = a1 (1 +i)1+ a9 (1 +5) 2 
ap (T SRE. + an, (ll RO 
Le cas que l'on rencontre le plus fréquemment est 
celui où les annuités sont égales : a, — a (k — 1, ., n): 
Vo s'écrit alors 
Vo= a[(1 +i)-1— …. (1 +) E ( +i) 7] 


Le second membre de cette expression est la somme 
d'une progression géométrique de premierterme a (1 +i)-1 
et de raison (1 -- /)-1. A l’aide d'une formule bien connue, 
on écrit : 


(3) Vo = 


= 


E (tableau 111) 


Si l'on connaît Vo et si l’on cherche la valeur de l’annuité 
a, on obtient : 
Vo‘i 
(4) QE 

1 — (1 + Ii)? 

Il peut être également intéressant de connaître la valeur 
acquise V, de la suite d'annuités au moment du dernier 
versement : elle est égale à la somme des valeurs acquises 
par les différentes annuités : 

Vn = a1 (1 +) 1 go (1 —i)r 21 La 

soit : Vn = Vo (1 + /)2. 


(tableau IV) 
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1972 1973 1974 1975 1976 1977 1978 1979 1980 1981 


80 000 


Y Tableaulll: valeur actuelle 
d'une suite d'annuités 

de 1 F versées 

pendant n années. 

Tableau IV : valeur 

des annuïités constantes 

qui amortissent en n 

années un capital de 1 F, 


Tableau II! - Valeur actuelle d’une suite d’annuités de 1 F versées 
pendant n années (cf. formule 3) 


0,915 332 
1,753 164 
2,520 059 
3,222 022 


0,913 242 
1,747 253 
2,508 907 
3,204 481 


10,413 708 


0,911 162 0,909 091 
1,741 377 1,735 537 
2,497 838 2,486 852 
3,187 096 3,169 866 


6,211 116 6,144 567 


10,158 513 9,914 815 


Tableau IV - Valeur des annuités constantes a qui amortissent 
en n années un capital de 1 F (cf. formule 4) 


1,092 500 
0,570 397 
0,396 816 
0,310 364 


0,157 539 


0,093 623 


1,095 000 
0,572 327 
0,398 580 


_ 0,312 063 


0,096 027 


1,097 500 1,100 000 
0,574 258 0,576 190 
0,400 346 0,402 115 
0,313 765 0,315 471 

0,263 797 


0,161 002 0,162 745 


0,098 440 0,100 859 
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Y Ci-dessous, tableau V : 
calculs permettant 
de fixer le montant 

des annuités 

jusqu'au remboursement 
intégral du capital. 

En bas, tableau VI: 
tableau d'amortissement 
d'un prêt de 200 000 F 
sur 5 ans à 10 %. 


LU 


ax = Dk-1i + Ak 


Autrement dit, la valeur acquise de la suite d'annuités 
est égale à la valeur acquise de sa valeur actuelle. 
Lorsque les annuités sont constantes, on obtient la for- 
mule : 
JL PNR 
(1 - î) 1 
Î 


Va 


Application aux emprunts 


Emprunt indivis 

Un emprunt indivis est une opération financière qui 
met en lice un emprunteur et un créancier : le créancier 
prête un capital K à son débiteur, lequel lui rembourse 
ce capital augmenté des intérêts sous forme d'annuités 
(que nous supposerons constantes pour la commodité 
du calcul). Comment fixe-t-on le montant de l'annuité, 
connaissant le taux / auquel est rémunéré le prêt ? Celui-ci 
est calculé de telle façon que la va/eur actuelle de la suïte 
des versements soit égale au montant du prêt : grâce à la 
formule (4) on écrit : 

Ki 

1— (1 +i) 

Ce mode de calcul est cohérent par rapport aux règles 
données plus haut. Cependant pour bien le comprendre, 
il est nécessaire de raisonner en va/eur acquise. 

Supposons que le créancier comme le débiteur aient 
tous deux la possibilité d'emprunter et de prêter de l'argent 
au taux /. Quels sont alors les comportements du créancier 
et du débiteur ? 

— Le créancier a le choix entre deux possibilités : 

* ne pas prêter le capital K à l'emprunteur en 
question et préférer le placer sur le marché pendant 
n années au taux / avec un remboursement en une seule 
fois au terme de ces n années; il récolterait alors K (1 +/)7; 

* accepter la proposition de l'emprunteur, ce qui 
lui rapporte chaque année une annuité a, soit au bout de 


(5) a 


Tableau V 


Dk = Dk-: - Ax 


Tableau VI 


Amortissement d’un prêt de 200 000 F sur 5 ans 


Somme 
restant due 


200 000,00 
167 240,60 
131 205,20 
91 566,32 
47 963,55 


Amortissement Annuités a 


20 000,00 
16 724,00 
13 120,52 
9 156,63 
4 796,85 


32 759,40 
96 035,40 
39 638,88 
43 602,77 
47 963,55 


52 759,40 
52 759,40 
52 759,40 
52 759,40 
52 759,40 
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n'années Vy = à (1 +i)?-12 a (1 —j)n-2 1. 
c'est-à-dire la valeur acquise de la suite d'annuités. 
Il n'acceptera cette proposition que si V, > K (1 +). 
— Le débiteur a lui aussi le choix entre deux possi- 
bilités : 

* accepter la proposition du prêteur d'un prêt 
remboursable en n annuités; 

* préférer emprunter le capital K sur le marché 
et rembourser en une seule fois K (1 + ;)* au bout des 
n années; mais il aurait alors la possibilité, sans que cela 
le gêne plus que dans la première possibilité, d'en consa- 
crer chaque année une partie a à un placement au taux , 
placement pouvant durer jusqu'à la n-ième année! 

Il se livrera à cette double opération (emprunter d'une 
part pour replacer de l'autre) si V, > K (1 + j)*. Par 
conséquent il n’acceptera la proposition du créancier que 
dans le cas où Vh < K (1 — ;)7. 

La loi de l'offre et de la demande conduit donc débiteur 
et créancier à se mettre d'accord sur l'égalité : 


Vn=K(1+i)t = Vo (1 +)? soit K = Vo 


d'où la justification de la formule (5). 

L'annuité est ainsi déterminée par deux éléments : le 
remboursement du capital et le paiement des intérêts sur le 
capital non encore remboursé (l'amortissement et l'intérêt). 

Dans la pratique, il importe de distinguer ces deux 
éléments. Du point de vue de l’entreprise, ils ne sont pas 
assujettis au même régime fiscal, les intérêts étant déduc- 
tibles de la base imposable (ils entrent dans la catégorie 
des frais financiers) et le remboursement du capital étant 
pris en compte au niveau des amortissements. 

Soit donc Az l'amortissement inclus dans la k-ième 
annuité, Dz la somme restant due (en capital) immédia- 
tement après le versement de la k-ième annuité. Le débiteur 
emprunte donc une somme K — Do qui lui est versée au 
début de la première année. A la fin de la première année, 
il paie à son créancier une première annuité a1, celle-ci 
comprend l'intérêt produit par le placement du capital Do 
pendant une année au taux /, soit Do/; la différence 
a1 — Do représente la part du capital A1 remboursée à la 
fin de la première année. 

Le capital restant dû pendant la deuxième année est 
donc D: — Do— A1; c'est donc sur D que sera calculé l'in- 
térêt compris dans la deuxième année. D'où 42 = /D1 + Az 
et ainsi de suite. jusqu'à la n-ième année. 

On représente cette suite de calculs dans un tableau 
(tableau V). 

A l'issue de la n-ième année, le capital est intégralement 
remboursé et donc D; — 0. Ainsi donc Az (1 + ;). 

Remarques : 

— le taux d'intérêt est supposé constant pendant 
toute la durée de l'emprunt; 

— les intérêts dus au titre de l’année écoulée sont 
obligatoirement versés puisqu'ils sont compris dans 
l'annuité; ils ne donnent donc pas lieu à capitalisation. 

Grâce aux relations entre ax, Dx et Az dans le tableau V, 
il est possible d'écrire une relation entre deux annuités 
consécutives et les amortissements qui y figurent. Nous 
avons : 


ax = Dx-1/+ A; 


An 


Dx = Dy-1— A; 
ax+1 = Dri+ A+; 

d'où l’on tire 4x ax+1= (Dx-1 D) {À + Ag 

(6) ag — 8x+1 = Ag (1 +i) — Ap+i 


A +1 


Emprunt à annuités constantes 

Lorsque a — ax, la formule (6) permet d'écrire 
Ag1 — Ag (1 +). Ainsi donc, la suite des amortisse- 
ments est une progression géométrique de raison (1 + ) 
et dont le premier terme est A1 — a — Do. Sachant que 


Do’ ; FR rs 
e — il est facile de vérifier que la somme 


MEET 


n 


des amortissements > Ai est égale au capital prêté Do. 
= 

Ces quelques règles suffisent pour établir le tab/eau 
d'amortissement d'un prêt (tableau V1) : il s'agit d'un 
tableau qui, année par année, indique l'intérêt payé, la 
part de capital remboursé ainsi que la somme restant due 
(dette non encore éteinte). 

Soit, par exemple, un emprunt de 200 000 F sur 5 ans 
à 10 %. A l’aide du tableau VI, on détermine le montant de 
l’annuité : a — 200 000 *X 0,263 797 — 52 759,40 F. 


Emprunt - Obligations 

Une entreprise (ou une administration) est souvent ame- 
née à emprunter une somme importante pour procéder à de 
nouveaux investissements. Pour cela il est fréquent qu'elle 
fasse appel non pas à un seul prêteur mais à plusieurs. 
L'emprunt est alors divisé en obligations (nominales où au 
porteur). La détention de celles-ci donne droit au verse- 
ment d'un intérêt annuel contre remise d'un coupon. 
Chaque année, un certain nombre d'obligations sont 
remboursées, en général par tirage au sort. Ce nombre 
est déterminé par le tableau d'amortissement (tableau VII). 

Exemple : considérons une entreprise qui émet un 
emprunt obligataire de C — 200 000 000 F réparti en 
200 000 obligations de 1 000 F, à un taux de 10 % sur 
5 ans en annuités constantes. Au terme de la k-ième année, 
l'annuité comprend une part d'intérêt et une part de 
remboursement Az du capital. Cet amortissement est 
réparti en obligations qui sont alors remboursées. Le 
Aë 
C: 

Il arrive parfois que le prix d'émission (E) des obliga- 
tions soit inférieur à leur valeur nominale (C) et que le 
prix de remboursement (R) lui soit supérieur. Dans ce 
cas, le taux réellement pratiqué est plus élevé que le taux 
annoncé. Le principe de calcul des Nz reste sensiblement 
le même. 


nombre Nz de titres remboursés est égal à 


Application à la mesure de la rentabilité des 
investissements 


Dans l'entreprise, l'investissement recouvre un grand 
nombre d'activités et de préoccupations : acquérir un 
nouvel outillage, organiser la formation de telle ou telle 
catégorie du personnel, développer un réseau commercial, 
acquérir une participation dans le capital d'une autre 
entreprise sont des activités que l’on appelle des inves- 
tissements. Malgré leur diversité, elles partagent en com- 
mun le fait qu'elles produisent leurs effets sur plusieurs 
années aussi bien dans les charges dont elles grèveront 
les finances de l’entreprise que dans les recettes qu'elles 
occasionneront. 

L'appréciation d'un investissement suppose que l'on 
ait à sa disposition une procédure d'arbitrage entre le 
présent et le futur de manière à comparer des entrées ou 
des sorties d'argent à des dates différentes. À côté des 
méthodes classiques permettant de mesurer la rentabilité 
d'un investissement, qui procèdent de techniques comp- 
tables (calculs de ratios) et qui donc ne font guère inter- 
venir le temps, il existe plusieurs méthodes fondées sur 
l'actualisation; il s'agit principalement de la méthode de 
la valeur actuelle nette (V.A.N.) et de celle du taux de 
rendement interne (T.R.I.). 

On suppose que la firme qui étudie un projet d'inves- 
tissement connaît avec certitude le nombre n d'années 
de durée de l'investissement, les dépenses Dz et les 
recettes Rx occasionnées par l'investissement lors de la 
k-ième année, 0 <K < n. 

On appelle cash-flow de la k-ième année la différence 
(algébrique) Cx — Rx — Dx; on convient, dans ce type 
d'analyse, de ne prendre en compte que les encaissements 
et décaissements effectivement réalisés (on ne prend 
en compte ni l'amortissement du matériel ni les provisions 
de toutes sortes) ; Cx peut être positif ou négatif suivant 
les années. Le plus souvent la suite des cash-flows est 
négative pour les premières années puis positive pour les 
suivantes (on parlera alors d'investissement convention- 
nel). 


La méthode de la valeur actuelle nette 

La valeur actuelle nette d'un investissement est la 
somme (algébrique) des valeurs actuelles de tous les 
cash-flows, calculées avec un taux / dit taux d'actualisa- 
tion, dûment choisi : 

n 
(7) VAN. = D Cx(1+i)-* 
= 0 

Exemple : soit l'investissement caractérisé par la 
suite des cash-flows : Co = — 14 000; C1 — + 4 000; 
C2 = + 6 000; C3 — + 8 000. Sa valeur actuelle nette 
à 10 % est (voir tableau Il) : 


VAN. = 
— 14 000 + 4000 *X 0,909 0 + 6 000 *X 0,826 7 —+— 
8 000 x 0,751 3 — + 595,2 F. 


Tableau VIi - Amortissement d’un emprunt 
de 200 000 obligations sur 5 ans 


Somme 
restant due 


200 000 000 
167 240 600 
131 205 200 
91 566 320 
47 963 050 


32 759 400 
36 035 400 
39 638 880 
43 602 770 
47 963 550 


Dans cet exemple, on suppose que le coût de l'inves- 
tissement (14 000 F) est intégralement supporté avant 
la première année. 

La méthode de la V.A.N. consiste donc à classer les 
projets d'investissement dans l'ordre décroissant de leurs 
valeurs nettes. Le projet correspondant à la plus élevée 
sera réputé le meilleur. 

Le choix du taux d'actualisation pose de multiples pro- 
blèmes. Il peut dépendre de la structure financière de la 
firme (il pourra être égal à ce que les financiers appellent 
le «coût du capital »), des taux en vigueur sur le marché au 
moment de l'élaboration du projet ou d'autres éléments 


LCL Indices de cours (page 43) 
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Amortissement 


Nombre de 
titres remboursés 


200 000 titres 


À Tableau VII : 

tableau d'amortissement 
d'un emprunt obligataire 
donnant lieu, 

chaque année, 

au remboursement 

d'un certain nombre 
d'obligations. 

Y L'obligation peut être 
nominale ou au porteur; 
sa détention donne droit 
au versement d'un intérêt 
annuel contre remise 
d'un coupon. 
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plus spécifiques. Ce choix relève de l'analyse financière 
proprement dite. 


Taux de rendement interne 

La valeur nette d'un investissement est une fonction 
V.A.N. (i) du taux d'actualisation. La formule (7) indique 
même qu'il s’agit d'un polynôme de degré n en (1 + ;)-1, 


n 
D'autre part V.A.N. (0) — ba CZ est positif (sinon l'in- 
k=0 
vestissement serait totalement improductif); lorsque 
i => + © VAN. (i) — Co qui est négatif si l’on a affaire 
à un investissement conventionnel. Dans un tel cas, on 
montre que la fonction V.A.N. (ji) est une fonction décrois- 
sante de / (pour ; > 0). Prenant des Valeurs positives et 
des valeurs négatives, il est clair qu'elle s'annule pour une 
certaine valeur (unique) du taux d'actualisation (f/g. 4). 

Le taux /o est appelé taux de rendement interne de l'in- 
vestissement. Plus ce taux est élevé, plus l'on dira que 
l'investissement est rentable. On classera donc des pro- 
jets par ordre croissant de taux de rendement interne. 

La détermination de cette valeur jo pose quelques pro- 
blèmes de résolution dans la mesure où V.A.N. (i) est 
un polynôme de degré n et que la recherche d'une racine 
ne peut se résoudre que par approximations successives 
(pour n > 3). 


Comparaison des deux méthodes 

La méthode du T.R.I. ne tient pas compte de la dimen- 
sion de l'investissement : en effet si un investissement est 
caractérisé par une suite de cash-flows {Cz}, l'investisse- 
ment ayant une suite de cash-flows {10 C-£} ou {1 000 Cz} 
aura le même taux de rendement interne. La méthode de la 
V.A.N., sur ce point, permet de prendre en compte la 
dimension de l'investissement. 

Cependant la méthode du T.R.I. fournit un critère 
objectif de rentabilité alors que la méthode de la V.A.N. 
suppose la connaissance d'un taux d'actualisation dont 
la définition, ainsi que nous l'avons dit, n’est pas exempte 
d'arbitraire et de subjectivité. 

Enfin la méthode de la V.A.N. permet de tenir compte 
de l'éventualité d’une variation de taux et donc de mesurer 
la rentabilité d’un investissement en fonction de diverses 
situations économiques possibles. 
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A La monnaie 

est l'objet de transactions 
s'établissant entre 

des prêteurs (banques, 
État, particuliers) 

et des emprunteurs 
(entreprises, banques, 
particuliers), moyennant 
un intérêt proportionnel 
au montant du prêt 

et à sa durée. 


» Figure 4: 

la valeur actuelle nette 
d'un investissement 

est une fonction V.A.N. (i) 
du taux d'actualisation. 
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MATHÉMATIQUES 
ET SCIENCE ÉCONOMIQUE 


La science économique est une science récente. À pro- 
prement parler, elle n'a guère que 150 ans; cela est bien 
peu à côté de la physique d'Archimède, de la médecine 
d'Hippocrate. Cependant, les hommes n'ont pas attendu 
la deuxième moitié du XIX® siècle pour exercer leur intelli- 
gence à la compréhension de la réalité économique. 
L'économie politique est donc plus ancienne : littéraire 
et volontiers rhétorique, elle est avant tout de l'ordre du 
discours. Mais, au fil des siècles, elle s'est révélée peu apte 
à rendre compte de phénomènes économiques dont la 
complexité évoque celle des phénomènes physiques et 
par là même appelle une démarche scientifique et rigou- 
reuse, c'est-à-dire l'élaboration de modèles. 

Un modèle est une représentation abstraite et sché- 
matique du système économique que l'on veut analyser. 
Ce système comporte un grand nombre d'éléments sujets 
à des interactions, à des influences que l'économiste, 
a priori, connaît peu ou mal. Se fiant à son expérience 
ou à son intuition, il va privilégier les éléments du système 
qui lui semblent les plus essentiels à son fonctionnement. 
Ils sont alors réduits à l'état d'objets mathématiques 
(nombre, vecteur, ensemble, fonction, variable aléa- 
toire, etc.). Quant aux liaisons de causalité et de dépen- 
dance qui existent entre eux et qui ont pu être mises en 
évidence, elles sont traduites en relations mathématiques 
(équations  algébriques ou différentielles, inéqua- 
tions, etc.). 

Le modèle appelle alors une résolution mathématique 
(résolution de systèmes d'équations, problème d'optimi- 
sation, etc.). Le résultat est ensuite confronté avec le 
système. Au cours de cette réduction du réel, certains 
éléments ont été privilégiés, certaines hypothèses de 
comportement ont été posées. En outre, l'existence de 
solutions du modèle exige parfois que certaines hypo- 
thèses mathématiques soient introduites. Tout cela condi- 
tionne le résultat acquis. L'étude du modèle consiste 
donc également à voir dans quelle mesure ce résultat 
dépend de toutes ces hypothèses. Dès lors, il s'agit de 
mettre en évidence les hypothèses critiques, celles dont 
l'absence ou la modification perturbe le résultat. 

On distingue deux types de modèles économiques : 
les modèles quantitatifs et les modèles qualitatifs. 

Dans les modèles quantitatifs on s'attache à étudier 
les phénomènes mesurables, pour lesquels on dispose 
de données, recueillies, triées et interprétées à l’aide de 
méthodes statistiques (tests, sondages, analyse facto- 
rielle, etc.). Il s'agit de modèles dits économétriques. 

Les modèles qualitatifs ont une tournure beaucoup 
plus théorique puisqu'ils traitent de phénomènes que 
l'on ne peut guère mesurer. Ces modèles sont plus jus- 
tement appelés modèles axiomatiques. Bien qu'ils ne 
puissent pas faire l'objet de vérifications expérimentales, 
ils gardent une valeur descriptive et scientifique. La 
réalité (surtout en sciences humaines) n'est point seu- 
lement ce qui est mesuré ou mesurable. 

Un modèle est donc, en tout état de cause, une repré- 
sentation simplifiée, figée, voire caricaturale du système 
économique. Une contradiction apparaît ainsi inexora- 
blement entre le modèle et la réalité qu'il prétend décrire. 
De l'approfondissement de cette contradiction émerge 
un nouveau modèle plus complet, prenant en compte 
un plus grand nombre d'éléments, établissant d'autres 
liaisons ou confortant les premières. L'étude de ce modèle 
fait apparaitre à son tour une contradiction avec la réalité 
d'où émerge alors un nouveau modèle et ainsi de suite... 

Les mathématiques sont ainsi d’une aide précieuse 
pour l'économiste puisque, par nature, elles le poussent 
à ne pas se satisfaire de son modèle, mais à définir de 
nouveaux objets, à établir de nouvelles liaisons plus géné- 
rales. Elles suggèrent des voies de recherche qui dans de 
nombreux cas se sont révélées fécondes. Les mathéma- 
tiques interviennent donc en économie avant tout en tant 
que démarche organisatrice de toute méthode scientifi- 
que et non point seufement comme un arsenal de recettes 
de calcul et de techniques dites quantitatives. Réduites à 
ce dernier rôle, les mathématiques restent d'un apport 
contestable en économie: elles justifient dès lors un 
certain ésotérisme de bon aloi et participent d'un scien- 
tisme mystificateur. Par contre, restaurées en une démarche 


axiomatique, elles se révèlent être un instrument d'analyse 
et de synthèse étonnamment puissant parce que conscient 
de ses propres limites, c'est-à-dire apte, dans un mouve- 
ment dialectique, à les dépasser par une confrontation 
critique avec le réel. 

Deux thèmes vont nous permettre d'illustrer le rôle 
joué par les mathématiques dans l'élaboration et dans la 


résolution de modèles axiomatiques : le problème de 
l'allocation optimale de ressources rares d’une part, et 
l'étude de la concurrence et des conflits de l’autre: le 
premier sera éclairé par le formalisme de la programmation 
linéaire, le second par celui de la théorie des jeux. 


Allocation optimale des ressources rares - 
Programmation linéaire 


Position du problème - 
Exemple 

L'entreprise Buchmoll et frères fabrique deux composés 
azotés : le chlorure d'’ammonium (NHA4CI) et le gaz 
ammoniac (NH3) à partir de l'azote (N), de l'hydrogène (H) 
et du chlore (Cl). La fabrication d’une unité de chlorure 
d'ammonium nécessite donc une unité d'azote, quatre 
d'hydrogène et une de chlore, celle de gaz ammoniac, 
une d'azote et trois d'hydrogène. 

L'entreprise dispose de 50 unités d'azote, 180 d'hydro- 
gène et de 70 de chlore. Elle vend sur le marché le chlorure 
d'ammonium et le gaz ammoniac respectivement aux 
prix de 5 et 4 francs l'unité. 
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Figure 1 : 

résolution graphique 

du problème d'optimisation 
de l'entreprise Buchmoll 

et frères. 


L'entreprise cherche à connaître le plan de production 
optimal, c'est-à-dire les quantités de NHACI et de NH3 
qu'elle peut techniquement fabriquer compte tenu des 
ressources en matières premières (N, H, CI) dont elle 
dispose et qui lui assurent le meilleur profit. 

Appelons x1 et x2 les quantités produites de NH4CI et 
de NH3. Cette production nécessite donc la transforma- 
tion de x1— x2 unités d'azote, de 4 x1 +— 3 x2 unités 
d'hydrogène et enfin de x1 unités de chlore. 

Compte tenu des disponibilités en ressources exis- 
tantes, le problème que doit résoudre l'entreprise Buch- 
moll et frères se met sous la forme d'un problème d'opti- 
misation : 

Maxz=5x1 + 4x2 


X1 + Xx2 < 50 
| 4 x1 + 3 x2 < 180 
x1 < 40 


(1) sous les contraintes : | 
| 
[X1>0, x2>0 


Ce problème se résout graphiquement dans le plan R? 
(fig. 1). L'ensemble des plans de productions technique- 


ment réalisables ia est représenté par le domaine P 


hachuré. Les droites d'équations 5 x1 — 4 x2 = cte sont 
parallèles. Le point C, intersection des droites d'équation 
X1 + Xx2 = 50 et 4 x1 — 3 x2 — 180, est celui pour lequel 
la fonction z — 5 x1 — 4 x2 prend la plus grande valeur : 


Xi = 30 x>2—20 z°— 230 


fig. 1 


X1+Xx2 = 50 


4x1+3Xx2 = 180 
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Forme générale d’un programme linéaire 

Le problème d'allocation optimale des ressources se 
présente de la facon suivante : l'entreprise dispose de 
p ressources rares (matières premières, équipements, 
main-d'œuvre, etc.) en quantités limitées (b1, …, b»), 
d'où le qualificatif « rares ». A l'aide de celles-ci, elle peut 
fabriquer n produits différents dont les prix unitaires de 
vente sont fixés au préalable et égaux à c1, C2, …, Cn. Dans 
ces conditions, quelles quantités x1, …, x, de ces n pro- 
duits l’entreprise doit-elle fabriquer de manière à maximiser 
son gain ? 

On suppose que pour fabriquer une unité du bien , il 
faut a;; unités de la ressource / (a:; = O signifie que la 
ressource / n'entre pas dans la fabrication du bien j). 
On suppose en outre que la fabrication de x; unités du 
bien / nécessite alors l'emploi de x; ‘ a;; unités de la res- 
source { (hypothèse de rendements constants et de com- 
plémentarité stricte des facteurs de production). Enfin 
on suppose que l’entreprise ne produit pas de quantités 
négatives [x; > O j—=1,.…,n]. 


X1 
Un plan de production est donc un vecteur k= É ] 
Xn 
de R? que l'on dira réalisable et dès lors qu'il satisfera 
au système d'inéquations : 


a11X1 + 812X2 + .… + &inXn < Di 


\ 821X1 + 422X2 + … + A2nXn < bo 
apiXi + 8p2X2 + … + 8pnXn < bp 
x > 0 x2>z 0..x1>0 
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Soit matriciellement, en posant 


le signe < signifie en l'occurrence que l'inégalité a lieu 
pour toutes les composantes. 

Parmi les plans de production réalisables, l'entreprise 
choisira celui qui maximise son profit représenté par la 
forme linéaire : 


X1 ñ 
Ce xD = lever]: É | = pi 


Xn j=1 


CiXÿ 


Un programme linéaire s'écrit sous la forme générale : 
>, 
Max ec, x} 
> > 
Ax < b 
> 
x> 0 


(2) 


La fonction Re —R x — t6; x s'appelle la fonction 
objectif du programme linéaire. 

Réécrivons le programme (2) en introduisant p varia- 
bles supplémentaires y;, appelées variables d'écart. La 
variable y; est associée à la -ième contrainte de la manière 
suivante : l'inéquation a;1Xx1 + .…. — &inXn < bi est équi- 
valente au système : 


{ &i1x1 &inXn + Yi = bi 
|lyZ0 
On définit ainsi un vecteur ÿ de R? et le programme (2) 
s'écrit : 
Max <c, x» + <O,ÿ) 
(3) AX+ÿ=h 
X>0 ÿ>0 


avec O = (0, … O) 
Le programme linéaire est dit alors mis « sous forme 
canonique ». 


Résolution d’un programme linéaire - Principe 
de la méthode du simplexe 

On démontre mathématiquement que la solution opti- 
male X* du programme (3) n'appartient jamais à « l'inté- 
rieur » du domaine réalisable mais toujours à sa frontière, 
c'est-à-dire au simplexe défini par les contraintes linéaires 
(c'est-à-dire dans l'exemple de la figure 1 : au pentagone 
OABCD). La méthode du simplexe est une méthode 
itérative d'exploration des sommets du simplexe : à 
partir d'un plan de production réalisable (par exemple 
Xj= Xo= = Xn= 0; y = b; i=1,.,p si le vec- 


Fe 
teur b a toutes ses composantes positives), on détermine 
un autre plan de production, pour lequel la fonction objec- 
tif prend une valeur plus grande. Le passage d'un plan 
à l'autre s'opère par des transformations matricielles 
(portant à la fois sur la matrice A et sur le covecteur c) 
fondées sur la méthode du pivot (voir Calcul numérique). 
La procédure d'exploration s'arrête lorsque l'on ne peut 
plus améliorer la fonction objectif. 


Programme dual 
Revenons à l'exemple de l'entreprise Buchmoll 

supposons qu'une autre entreprise, l'entreprise Dugom- 
mier et fils, veuille acheter les stocks d'azote, d'hydrogène 
et de chlore détenus par Buchmoll. Elle cherche alors à 
évaluer de manière optimale les prix us, u2, Us auxquels 
elle devra acquérir ces stocks. L'entreprise Buchmoll 
n'acceptera de se livrer à cette transaction que si elle 
n'est pas déficitaire : autrement dit, si elle ne peut pas 
gagner plus en produisant le chlorure d'ammonium et 
le gaz ammoniac et en les vendant aux prix de 5et4F; 
c'est-à-dire si la va/eur des matières premières nécessaires 
pour fabriquer une unité de NHACI est supérieure à 5 F: 


ui+4u2+u3>z 5 
de même, pour Nha, si elle est supérieure à 4 F: 
u1 + 3 u2> 4 


L'entreprise Dugommier, dans ces conditions, cherche 
à minimiser le coût de la transaction, c'est-à-dire à résou- 
dre le programme linéaire suivant : 
Min w = 50 u: 180 u2 
u1 — Aus — u3 > 5 
u1+—3u2> 4 
u1 > O u2 > 0 


40 U3 


Ce programme est appelé programme dual du pro- 
gramme (1); les variables u1, u2, us sont les variables 
duales (et, partant, x1, x2 les variables primales). 

La résolution graphique d'un tel programme est plus 
délicate (dans R31) ; néanmoins, on montre que, à l'opti- 
mum u3 — 0, la solution optimale est alors : 


w* = 230 


On remarque alors que w* — z* — 230; autrement dit, 
le coût minimal de la transaction subi par Dugommier 
est égal au bénéfice maximal que peut réaliser Buchmoll. 
Ceci est un résultat plus général et caractéristique des 
programmes linéaires. 

Reprenons le programme linéaire (2); on lui associe 
de semblable facon son programme dual : 


* * « 
u = 1 Us = 1 u3 = 0 


Primal Dual 
Max z CE, xd Min w <b, uy 
> 
AX < b üA > C 
x>0 ü>0 
On montre que, à l'optimum, on a l'égalité : 


(4) w* = z* 


Cette égalité nous permet d'interpréter les variables 
duales (uj, us, … u;), l'égalité (4) s'écrit : 


ñn 

* 
de GX; 

TEA 

. . * £ 

autrement dit, la variable duale uv; représente l'augmenta- 
tion de bénéfice réalisée par l'accroissement d'une unité 

* ’ . 
du stock de la ressource j; u; constitue donc une éva- 
luation (interne à l'entreprise) de la ressource j ; l'inté- 

rêt économique de cette valeur est alors le suivant : 
soit 7; { = 1,.., p, le prix du marché de la ressource j. 
Il est clair que l'entreprise aura intérêt à en acheter pour 

* * 
augmenter son stock tant que u; > 7. Lorsque uv, est 
nul, cela signifie que la contrainte correspondante du 
programme primal n'est pas saturée, c'est-à-dire que 
l'entreprise n'utilise pas la totalité de son stock. Toute 
augmentation de ce stock n'entraînerait aucun bénéfice 

supplémentaire. 


Co * 
+ 


CZ 
= = Uj 
è 


? + 
— biu; soit — 
È v 2b 


Rôle de la programmation linéaire en économie 

Les applications de la programmation linéaire sont de 
plus en plus nombreuses dans le domaine de l’entreprise. 
La programmation linéaire permet à un secteur de pro- 
duction de rationaliser son action en évitant le sous- 
emploi des ressources disponibles. Mais elle s'avère être 
plus qu'une technique mathématique de recherche opé- 
rationnelle : elle est avant tout un cadre conceptuel cohé- 
rent et rigoureux, très riche d'un point de vue micro- 
économique l'interprétation des variables duales à 
l'optimum donne à la théorie marginaliste un contenu plus 
pertinent. En outre elle contribue à éclairer certains points 
de l'analyse marxiste (valeurs et prix de productions). 


Concurrence et conflits - Les jeux 


Dans les salons du XVIIe siècle et dans les ruelles des 
grandes dames de cette époque, les jeux de société étaient 
fort prisés, et philosophes et mathématiciens s'essayaient 
à résoudre certains petits problèmes jugés fort divertis- 
sants : ainsi en témoignent les correspondances de qualité 
qu'échangeaient le chevalier de Méré et Pascal (1654). 
Mais il faudra attendre les travaux d'Émile Borel (1921) 
pour que ces questions reçoivent une formalisation 
mathématique satisfaisante. En 1928 le mathématicien 
allemand Johann von Neumann démontra le théorème 
fondamental ou théorème de minimax et joignit ses 
efforts à ceux de l'économiste viennois O. Morgenstern 
pour étudier l'application de la théorie des jeux à l’éco- 


nomie. Cette collaboration déboucha en 1944 sur la 
publication d'un ouvrage : Theory of Games and Eco- 
nomic Behavior. La théorie des jeux quittait alors les 
antichambres feutrées et les boudoirs fleuris pour devenir 
le formalisme mathématique propre à décrire les situa- 
tions de conflits et de concurrence. 


Présentation - Exemple d’un jeu à deux joueurs 
et à somme nulle 

On appelle jeu toute « situation » dans laquelle plusieurs 
individus (deux ou plus) sont confrontés et doivent 
prendre des décisions dont dépendent des résultats. 
Ainsi en est-il du bridge, des échecs, du duel au pistolet, 
de la guerre, d'une transaction commerciale, etc. Il est 
clair que le résultat (ou gain) d'un joueur va dépendre 
non seulement de sa propre décision mais aussi de 
celles prises par ses protagonistes. 

Exemple : deux joueurs sont face à face; le joueur A 
dispose de trois jetons, deux ronds et un carré, le carré 
et l'un des deux ronds sont blancs, l’autre rond est noir 
(O @ LL): le joueur B ne dispose que de deux jetons, 
un noir rond et un blanc carré (@ []). Le joueur A met 
un jeton sur la table sans le montrer à son adversaire 
qui en fait alors autant ; les jetons sont ensuite découverts. 
Si les deux jetons ont la même couleur, À donne 1 Fà B, 
sinon c'est B qui donne 1 F à A. Si les deux jetons sont 
de même forme, À donne 2 F à B; sinon c'est B qui donne 
2FàA. 

Un tel jeu se représente de deux manières : une forme 
dite développée et une forme dite normale. 

— Forme développée. On représente le jeu par un 
graphe (fig. 2) dont les sommets sont les points d'in- 
tervention des joueurs et les arcs les coups possibles. 

Pour chaque éventualité, on calcule le résultat du jeu : 
le premier nombre entre parenthèses indique le gain du 
joueur À, le second celui du joueur B. 


& (=, F1) 
a (+1,-1) 
e— ® (— 3, +3) 

————Ù «+3,-3) 


ÜU-—e (+ 3, — 3) 


TE _—— 
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— Forme normale. Un jeu ne se déroulant pas de 
manière instantanée, il y a en général plusieurs coups 
lorsque chaque joueur joue à son tour. En fait, on montre 
que tout jeu est équivalent à un jeu instantané (les joueurs 
ne jouent qu'une fois chacun) dans lequel une décision 
est un ensemble de décisions, appelé tactique : « Choisir 
une tactique revient pour un joueur à prendre globalement, 
avant de se mettre à jouer, toutes les décisions élémen- 
taires qu'il peut être amené à prendre au cours du jeu » 
(J. Bouzitat). On représente le jeu sous la forme d'un 
tableau (ci-dessous) : les tactiques du joueur A correspon- 
dent aux lignes, celles de B aux colonnes. A la croisée 
de la ligne ; et de la colonne /, on note le résultat du jeu 
lorsque A choisit la /-ième tactique et b la j-ième. S'agis- 
sant d'un jeu à somme nulle (ce qui est gagné par l’un 
est perdu par l'autre), on mentionne uniquement le 
gain du joueur A. 


Richard Colin 
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<« Figure 2 : 
représentation graphique 
du jeu (forme développée). 
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Quelles tactiques vont choisir À et B? Le choix qu'ils 
vont faire est commandé par la prudence : tous deux 
cherchent à minimiser leurs pertes. Si le joueur A joue ©, 
il ne peut récolter moins que « — 1 », s’il joue @ moins 
que « — 3 », s'il joue [] moins que « — 3 ». Il jouera 
donc ©. Le joueur B, quant à lui, qu'il joue @ ou [],ne 
peut pas perdre plus de 3. Il jouera donc, de manière équi- 
valente, soit [], soit @. 

Le joueur A choisit donc la tactique correspondant au 
maximum du minimum des lignes {maximin); B celle 
correspondant au minimum du maximum des colonnes 
(minimax). Le maximin est égal à — 1, le minimax à + 3. 

Ces valeurs sont différentes; on dit que le jeu n'a 
pas d'équilibre : ceci signifie que tout supplément d'in- 
formation concernant les intentions d'un joueur modifiera 
les comportements de son adversaire : si, par exemple, 
B se dit « À a joué © », il en conclut : « je vais jouer [] ». 
Le joueur À, à son tour, va se dire : « je vais faire croire 
à B que je joue ©, ainsi celui-ci jouera []; en réalité 
j'aurai joué @, ce qui.me rapportera 3 F. Mais B se dira: 
« je devine toutes les supputations qu'échafaude A, je 
vais donc jouer @ et celui-ci perdra 3 F » et ainsi de suite... 

Ce jeu est dit à information imparfaite : le joueur B 
ne connaît pas précisément ce que À a joué. Il sait seule- 
ment que le choix de A appartient à un certain ensemble 
= {O, 6, CO}. 

On peut envisager des jeux à information parfaite : 
à chaque coup, le joueur sait exactement ce que vient 
de jouer son adversaire; les échecs et les dames sont 
des jeux de ce type. Un théorème fondamental, le théo- 
rème de Zermelo-von Neumann-Kuhn, montre que 
tout jeu fini à information parfaite admet un équilibre. 
C'est dire qu'au jeu d'échecs il existe une tactique qui 
assure la victoire ou le match nul contre toute défense. 
Il serait possible de la trouver si l’on savait mettre le jeu 
d'échecs sous forme normale, c'est-à-dire dresser l'inven- 
taire de toutes les tactiques possibles en fonction de toutes 
les éventualités envisageables par l'adversaire. Ceci 
dépasse largement les capacités d'énumération des ordi- 
nateurs les plus perfectionnés ! 

Reprenons l'exemple donné en le modifiant : le joueur A 
ne cache plus son jeu mais le joueur B a les yeux bandés 
et il peut toucher le jeton joué par A. Ce dernier est donc 
en mesure de distinguer deux ensembles d'information 
{O, @} et {[}. Il sait si le jeton appartient au premier 
ensemble ou au second. Ce surcroît d'information aug- 
mente le nombre de tactiques qu'il peut envisager. Elles 
sont au nombre de 4: 


t1 jouera @ si le jeton de A est rond, @ s'il est carré, 
t jouera @ si le jeton de A est rond, [] s’il est carré, 
t3 jouera [] si le jeton de A est rond, [] s'il est carré, 
ta jouera [] si le jeton de A est rond, @ s'il est carré. 


Sous forme normale, le jeu est représenté par un tableau 
à 3 lignes et 4 colonnes (ci-dessous) : 
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Il est clair que B va jouer &, car elle lui assure la perte 
minimale (il ne peut pas gagner moins de 1 F). Il est non 
moins clair que À jouera la tactique ©, correspondant à 
la perte minimale pour lui (il ne peut pas perdre plus de 
1 F). Ici, le minimax est égal au maximin (— — 1). Les 
deux joueurs n'ont aucun intérêt à jouer d'autres tactiques 
que celles-là. 

Tout supplément d'information sur les intentions d‘un 
joueur ne modifie pas la décision de son adversaire : 
le joueur B ne gagnerait rien à connaître aussi la couleur 
du jeton de A... 


Stratégies dans un jeu à deux joueurs 
Un jeu à deux joueurs et à somme nulle sous forme nor- 
male est représenté par une matrice 


Are mie ln: 0) 
à m lignes et n colonnes. Les lignes correspondent aux 
n tactiques du joueur (A), les colonnes aux m tactiques 
de B. aij est donc le gain réalisé par le joueur A lorsque 
celui-ci adopte la tactique / et son adversaire la tactique /. 
En général un tel jeu n’admet pas d'équilibre, autrement dit : 
Min Max a;; Æ Max Min 4; 


=) = 1... j=1,..m 
On montre que l'on a toujours l'inégalité 
Max Min < Min Max. 


Il convient donc de donner à ce concept d'équilibre une 
acception plus générale : on élargit la notion de tactique 
en définissant celle de stratégie : on considère alors que 
les joueurs A et B ont la possibilité de jouer leurs tacti- 
ques selon une certaine loi de probabilité. À chaque loi 
de probabilité choisie par B correspond un gain que A 
pourra espérer s'il choisit une tactique donnée. Ce gain 
espéré est défini comme la valeur moyenne des gains 
pour chaque tactique de B et pour la tactique donnée de À, 
cette moyenne étant calculée à l’aide des pondérations 
obtenues dans la loi de probabilité choisie par B. 

Plus précisément, on appelle stratégie du joueur A une 
distribution de probabilité x1, x2, …, xm définie sur ses 
m tactiques. Une telle stratégie sera notée X (vecteur ligne) 

m 
avec x; > 0 L: xj = 1. 
j=l 

De la même façon une stratégie du joueur B est une 
distribution de probabilité y1, …., Yn sur ses n tactiques, 


n 
notée Ÿ (vecteur colonne) avec y; > 0; pi yi = 1. 


I 
Lorsque À joue X et B joue Y, l'espérance de gain 
réalisée par À est donnée par: 
m n 
> 2. XjYiaiÿ = XAY 
j=lisi 
La stratégie X* optimale pour A est celle correspon- 
dant au gain maximal, une fois que B a choisi la stratégie 
qui défavorise le plus A: 


X* tel que Max Min XAY. 


De même la stratégie Y* optimale pour B : 
Y* tel que Min Max XAY. 
Y x 


Le théorème de von Neumann, dit théorème de 
minimax (1928), montre que dans une telle situation l'on 
obtient toujours un équilibre (en termes de stratégie 
cette fois et non plus de tactique). Autrement dit : 

X*AY* = Max Min XAY = Min Max XAY. 
X Y Y x 

Ce résultat s'établit en remarquant que les stratégies 
X et Y des joueurs À et B sont respectivement solutions 
des deux programmes linéaires : 


Max u Min w 

XA > uJ AY < wl 

X> 0 Y>0 

: [1,1] 
où Les (TE Lo Jr et 

i n 


Ces deux programmes sont en dualité. Si X* est solu- 
tion de |, Y* solution dell,ona: 


Max u — Min w = X*AY*. 


Jeux à n joueurs 

Un jeu à n joueurs se représente tout aussi bien sous for- 
me extensive que sous forme normale. Sous cette dernière, 
on admet que les joueurs jouent de manière instantanée 
des tactiques o1, 62, …, on (ou des stratégies). Chaque 
joueur recoit alors un gain qui dépend de son propre choix 
et de celui de ses protagonistes. Mathématiquement, 
le joueur / choisit une stratégie o;, considérée comme 
appartenant à un certain ensemble Y;, il reçoit alors un 
gain G:; (61, 62, …, 65, …, Gn). Un n-uplet de stratégies 
61, 62, …, 6h Sera dit en équilibre si : 


Vi=1,.nVoeZ: Gi (61 62 …, Gi, Gi+1, .… On) 
< G; (61, O2, …, Gi, …, On) 


Si un tel équilibre est réalisé, aucun joueur seu/ n'a 
intérêt à changer de stratégie. L'existence d'un tel équi- 
libre est assurée par certaines hypothèses mathématiques 
sur les ensembles Y; et sur les fonctions G; (théorème 
de Nash). 

Les jeux à n joueurs sont intéressants en ce qu'ils 
donnent la possibilité à certains d'entre eux de s'unir, 
c'est-à-dire de former des coalitions. Soit N = {0, 1, …, n} 
l'ensemble de tous les joueurs; on appellera coalition 
toute partie S de N. Un jeu sera dit coopératif si sa règle 
n'interdit aucune coalition. 

Considérons un jeu à somme constante : 


ñ 
D Gi (01 … on) = K Voie Xi 


= 1 


Supposons, pour une meilleure interprétation, que K repré- 
sente un certain capital. Les joueurs appartenant à une 
coalition S donnée ont la possibilité d'opérer des trans- 
ferts d'argent entre eux. Sous cette hypothèse, on est 
désormais en présence d'un duel qui oppose deux coali- 
tions : la coalition S et la coalition N-S. Ce duel admet une 
solution (d'après le théorème de minimax si celui-ci est 
fini). Soit V (S) le gain total réalisé par la coalition S. 
C'est la valeur du jeu pour $S : cette coalition est sûre, en se 
formant, de gagner au moins V (S), quoi que fassent les 
autres joueurs. Il est clair que l'on a l'égalité : 


K = V (N) = V (S) + V (N—S). 


Ainsi définit-on une application V:P (N) +R que 
l'on appellera fonction caractéristique du jeu. Elle possède 
les deux propriétés suivantes : 


(a) V(Z)=0 
(b) V(SUT) > V (S) + V (T) lorsque S NT = S 
(l'union fait la force). 


Un jeu sera dit /nessentiel si on a l'égalité en (b) et 
essentiel dans le cas contraire. Dans les jeux inessentiels, 
les joueurs ne gagnent rien à constituer des coalitions. 
Seuls ceux qui sont essentiels sont dignes d'intérêt. 

Une imputation est le résultat du jeu après redistribution 
des gains au sein des coalitions. Dans un jeu à somme 


: , ‘ , De 
constante il s'agit donc d'un vecteur u — (u1, …, Un) tel 
que : 


n 
D ui=V(N) 
i=1 

V{i} < u; Vi, où {i} représente la coalition réduite au 
seul joueur j. 

Cette dernière condition stipule qu'une imputation est 
admissible par tous les joueurs pour autant qu'elle assure 
à chacun au moins ce qu'il aurait gagné à jouer seul 
contre tous les autres. 

Résoudre un tel jeu, c'est déterminer la ou les imputa- 
tions correspondant à des situations d'équilibre, c'est-à- 
dire qu'aucun joueur n'a intérêt à refuser. On cherche à 
éliminer toutes les imputations qui ne pourront raisonna- 
blement être choisies. 

On dira qu'une coalition S (Æ Z) bloque une imputa- 
tion à si Du; < V (S). 

ÎeS 

Quoi qu'il advienne, la coalition S refusera l'imputation u 
puisqu'elle peut gagner plus en se formant contre les 
autres. On en vient à définir ainsi le concept de cœur. 


Le cœur d'un jeu est l'ensemble des imputations qui 
ne sont bloquées par aucune coalition. Il est clair que le 
choix d'une imputation prise en dehors du cœur conduira 
derechef à la formation d'une coalition qui, s'estimant lésée 
dans le partage, provoquera le conflit au terme duquel 
elle est sûre de parvenir à une position plus favorable. 

Malheureusement, le cœur d'un jeu est parfois vide : 
on montre ainsi qu'un jeu essentiel à somme constante 
a un cœur vide. Ce résultat est bien troublant dans la 
mesure où il établit que le cœur d'un jeu coopératif à 
somme constante n'existe que si aucune coalition n'a 
intérêt à se former! En fait les jeux à somme constante 
ne sont pas les plus généraux que l'on puisse imaginer 
(notamment dans les modèles économiques). En outre 
il est peu vraisemblable de supposer que toutes les coali- 
tions ont la possibilité de se former. 
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MATHÉMATIQUES ET SOCIÉTÉ 


Nous recourons aux mathématiques pour connaître 
et dominer les divers phénomènes naturels, mais aussi 
pour organiser toutes les informations que nous recueil- 
lons de quelque manière, encore que nous sachions que 
l'approche mathématique laisse échapper ou écarte déli- 
bérément maintes circonstances de ce que nous obser- 
vons. Or cette approche n'a pas toujours existé et n'est 
pas une disposition naturelle à toute société. Cela impose 
une première constatation : nous vivons dans une société 
à laquelle l'élément mathématique est, sous une forme ou 
sous une autre, intimement incorporé. Non qu'il n'y ait 
pas eu de mathématiques ailleurs, mais c'est dans la 
société actuelle que leurs applications se sont étendues, 
que leur développement est systématiquement encouragé, 
que leur existence s'est vraiment institutionnalisée, bref 
qu'elles jouissent d'un véritable privilège social. 

Cette impression peut être confirmée non seulement 
par des observations courantes, mais encore par une 
analyse historico-sociale du développement des mathé- 
matiques depuis la fin du XIX® siècle. Certes, pendant 
tout le XVIIIe siècle et au début du siècle suivant, les mathé- 
matiques « régnaient dans les Académies », en vertu du 
fait, universellement reconnu, que leur discipline avait 
valeur instrumentale, qu'elle était indispensable aux 
sciences de la nature; mais cette prééminence était tout 
de même loin de s'affirmer aussi amplement qu'aujourd'hui, 
c'est-à-dire au point, comme on l'a écrit, de « diriger notre 
monde au nom de sa logique inexorable ». Au contraire, 
ainsi que l’a remarqué Pierre Samuel, « pendant fort 
longtemps, il allait presque de soi qu'un élève destiné à 
de longues études et à de hautes fonctions sociales, 
devait faire du latin et même, si possible, du grec ». Ce 
fait vaut d'être souligné, car il a une signification sociale; 
et il est même l'indicateur principal du rôle actuellement 
dominant des mathématiques dans la société. 

Étant donné son caractère relativement récent, cette 
prééminence des mathématiques doit pouvoir s'expliquer. 
Elle n'est sans doute pas due à une subite sensibilité 
collective aux charmes de cette discipline on ne peut plus 
abstraite, et personne aujourd'hui n'irait justifier la vogue 
mathématicienne, s'il y succombe, par l'attrait que cette 
science exerce en vertu des rapports « d'ordre, de propor- 
tion et d'harmonie » qui s'y manifestent, ou de la beauté 
et de la symétrie des théorèmes qui y sont établis. D'une 
part, personne n'est mathématicien né, et nous ne sommes 
plus à l'époque de Pythagore, d'autre part, les mathéma- 
tiques connaissent aujourd'hui bien des phénomènes 
discordants, et ne s'intéressent pas aux seules propriétés 
où se manifestent ordre et beauté. Du reste, la tendance 
actuelle est plutôt, par exemple, à la préférence de 
l'algèbre à la géométrie, de la mémoire à l'imagination, 
si l’on nous permet d'employer ce langage désuet. Or, 
et nous citerons de nouveau un mathématicien, « l'évic- 
tion de la géométrie serait essentiellement un problème 
sociologique ». Il y a donc quelque chose, dans les 
mathématiques, qui concerne la société et se trouve 
concerné par elle. 

La question des rapports entre les mathématiques et la 
société se pose donc naturellement aujourd'hui. Mais 
où trouver les éléments d'une réponse, sinon dans une 
théorie sociologique de la connaissance mathématique ? 
Et d'abord, y a-t-il déjà des théories sociologiques de la 
connaissance mathématique susceptibles de nous mettre 
sur la bonne voie ? 

Pour étayer les remarques par lesquelles nous avons 
commencé, nous devrions disposer d'une théorie du 
savoir mathématique qui nous explique les aspects de 
son développement et les faits qui échappent à la contrainte 
strictement mathématique. Or une telle théorie n'existe pas. 
Bien que la sociologie de la connaissance soit née avec 
la sociologie même, les doctrines sociologiques n'ont 
manifesté aucun intérêt spécifique aux mathématiques. 
C'est donc par le biais d'une sociologie générale de la 
connaissance que, pour le moment, nous aborderons le 
problème. 

Mais ce recours ne saurait nous satisfaire entièrement, 
car il peut arriver qu'une théorie sociologique décrive 
assez exactement des faits ou des phénomènes vrais pour 
certains types de connaissance, mais non vrais pour la 
connaissance mathématique et n'offrant rien que la com- 
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munauté mathématicienne puisse reconnaître comme 
essentiel à son intérêt le plus proche. On peut apporter 
des preuves certaines d'une « collusion », ou d’une « com- 
plicité » ou d'une « correspondance » entre une société 
donnée et telle « philosophie », « idéologie », « théorie 
sociale » ou « théorie politique ». Mais le genre de parallèle 
qui donne généralement lieu à un rapprochement entre 
les produits « idéologiques » d'une société et certains de 
ses aspects infrastructurels — c’est-à-dire non mentaux — 
est peu convaincant lorsqu'il s'agit de sciences, et de 
mathématiques en particulier. 

En effet, s'il est aisé de montrer que toute science exacte 
institutionnalisée véhicule un ensemble d'idées et de 
représentations qu'elle n'implique pas logiquement, il 
est quasi impossible de découvrir une homologie qui 
ne soit ni arbitraire ni triviale entre le statut des disciplines 
mathématiques d'un côté, et de l'autre les caractères par 
lesquels on décrit, par exemple, l'entrepreneur capitaliste 
ou l'idéologie technocratique. Par ailleurs, il est certain 
que « l'influence sociale », la mainmise de la société sur 
les mathématiques, se fait par le truchement d'autres 
disciplines, les sciences physiques le plus souvent, la 
philosophie parfois; pour ce qui est des mathématiques 
elles-mêmes, on est en présence de structures abstraites 
auxquelles il est impossible de faire correspondre des 
segments de réalité sociale vivante, ou des segments 
d'idéologie. En effet, l'étalonnage socio-idéologique des 
formes de la mathématique permettrait de rapporter à 
sa place idéologique et sociale toute forme historique 
ou géographique de la mathématique. Ce qui ne saurait 
se faire sans une identification et une distinction des 
formes de la mathématique. Or, cette tâche, discutable 
dans son principe, est difficile à réaliser dans la pra- 
tique, car on ne peut faire correspondre univoquement 
à une formation sociale donnée une forme mathéma- 
tique déterminée. 


Les théories sociologiques 


On n'en doit pas moins reconnaître que, malgré leur 
insuffisance à suivre les axes de la pensée scientifique 
actuelle, malgré leur vieillissement, et malgré leur défaut, 
d'une étude précise des mathématiques en particulier, 
distinctes des autres secteurs scientifiques, les théories 
sociologiques de la connaissance ont eu le mérite incontes- 
table d'introduire la problématique sociale du savoir. Or, 
pour que cette problématique apparaisse, il fallait que 
l'élément social cessât d'être quelque chose d'accessoire 
et de complémentaire, imaginé par la nature pour parvenir 
à ses fins, comme le croyait Kant, par exemple, lorsqu'il 
écrivait que « toute culture, tout art formant une parure de 
l'humanité, ainsi que l'ordre social le plus beau, sont 
les fruits de l'insociabilité, qui est forcée par elle-même 
de se discipliner, et d'épanouir de ce fait complètement, 
en s'imposant un tel artifice, les germes de la nature ». 
Il fallait prendre au sérieux les relations de fait et de 
principe qui existent entre les développements du savoir 
et les formes de la culture, dont le savoir porte l'empreinte 
et dont il n'est jamais qu'une province. Il fallait substituer 
à l'analyse, conçue dans le style du XVIIIe siècle, des pro- 
priétés et des formes de la représentation qui permettaient 
la connaissance en général, la nécessité de mettre au 
jour les conditions de la connaissance à partir des contenus 
empiriques qui sont donnés en elle. Aussi est-ce chez 
Auguste Comte que l'on trouve une théorie du savoir 
qui veut en être la sociologie, et une sociologie où les 
mathématiques sont analysées, avec, pour l'époque, tout 
l'intérêt qu'elles méritent. 

Le point de vue de Comte ouvre effectivement une 
perspective à l'étude sociale de la connaissance, parce 
qu'il se propose la fondation d'une science de la société, 
susceptible de fournir les bases d'une philosophie de la 
connaissance. Aux yeux de Comte, il n'y a pas de connais- 
sance qui ne s'explique par la nature sociale des hommes 
et qui cesse un seul instant d'être enfermée dans quelque 
société. 


La théorie de Saint-Simon 


D'aucuns objecteraient que c'est là un type de démarche 
antérieur au positivisme; que Saint-Simon, par exemple, 
est allé plus loin qu'Auguste Comte, dans cette voie, par 
sa critique vigoureuse de Condorcet qui affirmait la pri- 
mauté du progrès de ia connaissance sur le progrès social. 


Saint-Simon fut, en effet, le premier à avancer aussi 
clairement l'existence d'une correspondance constante, 
en tous les temps, chez tous les peuples, entre les insti- 
tutions sociales et les connaissances, correspondance que 
Condorcet saisissait globalement dans l'association natu- 
relle, en un seul mouvement, de tous les types de progrès, 
dans les sciences aussi bien que dans les mœurs. D'autre 
part, Saint-Simon rend, certes, possible une réflexion 
sociale sur le savoir lui-même, dans la mesure où il 
marque une tendance profonde au panthéisme, laquelle 
permet de traiter les réalités intellectuelles et les réalités 
concrètes comme des émanations d'une seule nature et 
de considérer, ce qui est nouveau sous des mots anciens, 
que la « science de l'homme » étudie aussi bien « la pro- 
duction des biens matériels par le travail sous différentes 
formes » que « la production des manières de connaître ». 
Certes encore, tous lestypes de travail ettoutes les manières 
de produire ne sont susceptibles d'une étude que parce 
qu'il existe « une science, bien plus importante pour la 
société que les connaissances physiques et mathéma- 
tiques », et cette science, c'est celle qui étudie les fonde- 
ments de la société elle-même. Or, cette science révèle 
le potentiel de la collectivité humaine dominée par l'avè- 
nement de la classe industrielle, avènement qui fait penser 
que « le paradis n'est pas en arrière de nous ou dans la vie 
céleste, mais dans notre vie future, sur terre ». Certes, 
enfin, tout cela ne va pas sans privilèges pour les 
mathématiques. Car, si « le parti industriel » est investi 
d'un tel espoir, c'est précisément parce que « ce parti 
possède la force du raisonnement », « ceux qui cultivent 
les sciences positives (qui sont les meilleurs raisonneurs) 
étant de son côté », et devenant de plus en plus nombreux. 

Les transformations sociales ont, en effet, entraîné une 
nouvelle hiérarchie du savoir, où les sciences positives 
occupent la première place. « Au XV= siècle, écrit Saint- 
Simon dans le Mémoire de la science de l'homme (1813), 
l'enseignement public était presque entièrement théo- 
logique. Depuis la réforme de Luther jusqu'à la brillante 
époque du siècle ce Louis XIV, l'étude des auteurs pro- 
fanes, grecs et latins, s'est introduite par degrés dans 
l'instruction publique. de manière que la science dite 
sacrée a été reléguée dans des écoles spéciales, auxquelles 
on a donné le nom de Séminaires. Sous le règne de 
Louis XV, les sciences physiques et mathématiques ont 
commencé à faire partie de l'instruction publique; sous 
le règne de Louis XVI, elles y ont joué un rôle important; 
enfin, les choses sont arrivées au point qu'elles forment 
aujourd'hui la partie essentielle de l'enseignement... 
Telle est la différence, à cet égard, entre l'ancien ordre 
et le nouveau... que pour s'informer... si une personne 
avait recu une éducation distinguée, on demandait 
Possède-t-elle bien ses auteurs grecs et latins? et qu'on 
demande aujourd'hui : Est-elle forte en mathématiques ? » 

On pourra méditer ce texte, que nous avons cité pour 
son actualité. Et pourtant on ne peut véritablement parler, 
chez Saint-Simon, d'une sociologie dont les mathéma- 
tiques constitueraient une préoccupation explicite. Saint- 
Simon, loin de nous fournir, fût-ce les rudiments sinon 
les principes d'une interrogation sur les mathématiques 
du point de vue de la société, ne nous livre qu'un témoi- 
gnage sur la conscience que le début du XIX® siècle avait 
du rapport entre l'enseignement des sciences positives, 
des mathématiques en particulier, et l'essor industriel 
à ses débuts. De fait, c'est à Auguste Comte que revient 
la priorité dans la considération des types du savoir, 
en tant que constitutif de l'organisation sociale, pour 
autant que celle-ci est chaque fois l'expression du rapport 
d'un collectif humain à l'univers qui l'entoure. 


Le point de vue d'A. Comte 


Point remarquable, A. Comte a vu et établi que la 
condition nécessaire et suffisante à la constitution d'une 
science sociale, c'est-à-dire à l'accès de la société au 
statut d'objet de connaissance, consiste à prendre acte 
du fait qu'il est devenu impossible « de méconnaiïtre la 
destination finale de l'intelligence humaine pour les 
études positives ». Autrement dit, tout phénomène, quelles 
que soient sa nature et sa complexité, comporte un aspect 
par lequel il est accessible à une connaissance positive. 
Mais, simultanément, il faut prendre acte du fait que « la 
philosophie positive », telle qu'on peut l'appréhender 
à travers la constitution du savoir astronomique, physico- 
mathématique, chimique, etc., n’embrasse pas tous les 


ordres de phénomènes. Bref, il faut encore exécuter « une 
grande opération scientifique » pour donner son statut 
au savoir dont l'objet serait la sphère des phénomènes 
sociaux. Ce qui ne peut se faire par simple extension 
du domaine de positivité déjà constitué. Entendons qu'il 
ne saurait y avoir de science sociale par simple transport 
de méthodes déjà établies; en un mot, il ne suffit pas 
d'appliquer des procédés numériques aux phénomènes 
sociaux pour constituer une science sociale. La société, 
étant le lieu même où tout savoir se produit, n'est pas 
accessible à l'un des savoirs qu'elle constitue. C'est 
pourquoi toute la philosophie positive ne vise enfin, à 
travers la classification des sciences qu'elle a promue 
au niveau d'un problème philosophique fondamental, 
qu'à établir « la prééminence philosophique de l'esprit 
sociologique sur l'esprit mathématique », car « la liaison 
mathématique entre les phénomènes ne saurait être que 
précaire et stérile, en même temps que forcée et insuffi- 
sante », si l'on se contente de la fonder sur de « vagues 
et chimériques hypothèses ». La société, comme objet 
de science, est irréductible aux autres phénomènes, plus 
élémentaires. 

Il en résulterait normalement que toute manifestation 
particulière du savoir se trouverait en liaison fondamentale, 
d'abord de manière générale avec les conditions orga- 
niques dont elle dépend, ensuite, et en particulier, avec 
la forme de société où elle se développe. La loi historique 
des trois états exprime cette relativisation des connais- 
sances, chaque branche passant par trois étapes suc- 
cessives : l'état théologique ou fictif, où l'on distingue 
encore trois âges essentiels, ceux du fétichisme, du 
polythéisme et du monothéisme; l'état métaphysique 
ou abstrait ; enfin, l'état scientifique où positif. 

Cette progression en trois degrés se voit d'abord dans 
la facon dont se transmettent les mathématiques. On 
peut penser, par exemple, qu'à l'âge théologique, l'en- 
seignement consiste à communiquer des recettes tech- 
niques. Qu'à l'âge métaphysique, s'effectue quelque chose 
comme une dispersion des mathématiques parmi des 
calculs exacts mais partiels. Qu'à l’âge positif, enfin, il y 
aurait une organisation du savoir mathématique conscient 
désormais de son rôle et de son potentiel. 

La perspective d'A. Comte n'est heureusement pas 
aussi simple. À. Comte remarque d’abord qu'alors qu'un 
géomètre de l'Antiquité se formait par l'étude successive 
d'un très petit nombre de traités originaux, essentielle- 
ment les écrits d'Archimède et d'Apollonius, « un géo- 
mètre moderne a communément terminé son éducation, 
sans avoir lu un seul ouvrage original, excepté relative- 
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ment aux découvertes les plus récentes, qu'on ne peut 
connaître que par ce moyen ». Ce qui veut dire qu'une 
sociologie moderne des mathématiques est obligatoire- 
ment, pour une part au moins, une sociologie des manuels 
plutôt que des mémoires originaux de mathématiques. 
Le manuel s'est désormais imposé comme intermédiaire 
indispensable entre la société et les mathématiques. 
Ensuite, Comte saisit clairement que la révolution carté- 
sienne, qui rendit possible la géométrie analytique, impli- 
que que l'organisation vers l'objet mathématique se soit 
elle-même modifiée; la révolution cartésienne est une 
véritable libération des forces intellectuelles, qu'elle dirige 
vers des questions plus générales, à l'aide de notions 
nouvelles, qu'on n'aurait jamais pu introduire « en ajou- 
tant quelques nouvelles courbes » au petit nombre de 
celles qu'on avait déjà étudiées par l'ancienne méthode. 
Si celles-ci n’intéressent plus le mathématicien, cela tient 
à ce que la révolution philosophique opérée en géométrie 
par Descartes « a dû singulièrement diminuer l'impor- 
tance de semblables recherches ». 

Ne relevons pas davantage de remarques de détail, 
bien qu’elles soient, chez A. Comte, plus importantes que 
ce qu'on lit dans les développements consacrés explici- 
tement aux mathématiques, lesquels véhiculaient les 
idées courantes dans le milieu de l'École polytechnique, 
au temps où notre auteur en était l'élève. En multipliant et 
en rassemblant des notations du genre de celles dont nous 
avons reproduit l'essentiel au paragraphe précédent, 
on s'apercevrait qu'elles tendent à une certaine unité 
et qu'elles résistent encore aujourd'hui à la critique. 

Maints sociologues du savoir ne font actuellement 
qu'énoncer doctement des faits qui constituaient des 
évidences pour À. Comte, bien qu'en raison de l'idéalisme 
alors dominant ils ne fussent pas immédiatement intelli- 
gibles à son époque : par exemple, l'idée que l’« élément 
scientifique » entretient des relations, non seulement plus 
ou moins directes, mais encore absolument organiques, 
avec certaines demandes militaires. Jusqu'alors, dit 
Comte, la science avait recu des encouragements facul- 
tatifs ; à présent la protection des sciences devient systé- 
matique, et, « pour tous les gouvernements occidentaux, 
un véritable devoir », en vertu de la liaison étroite des 
sciences exactes avec les procédés militaires et avec 
l'essor industriel. Or, ce dernier est, à son tour, conditionné 
« spécialement par l'institution des armées soldées ». 
D'autres institutions, au dessein non moins militaire, 
semblent, d'après un mathématicien contemporain, René 
Thom, à l'origine de l'engouement actuel pour les mathé- 
matiques; le lancement des satellites aurait joué le rôle 
de l’aimant attirant l'attention du public sur les techniques 
mathématiques. 

Il va sans dire que Comte n'a pas systématisé cette 
théorie des rapports entre les mathématiques et l'organi- 
sation sociale ; elle reste pour une grande part implicite et 
ne reçoit pas toute la précision voulue. Mais justement, 
cette esquisse qu'il nous a laissée est d'autant plus pré- 
cieuse qu'elle n'a été ni reprise ni complétée après lui. 
C'est qu'en fait les choses sont délicates. Comte, comme 
tous les philosophes traditionnels, n'a pas manqué de 
souligner l'originalité des mathématiques, leur autonomie 
(relative) à l'égard du social. Ce qui s'explique, selon 
lui, de deux facons. D'une part, l'esprit positif se manifeste 
dès l'origine, bien qu'il soit encore dominé parles croyances 
non positives. Le germe de la philosophie positive est 
tout aussi primitif que celui de la philosophie théologique, 
bien qu'il n'ait pu se développer que plus tardivement. 
D'autre part, et plus particulièrement, les rudiments de 
positivité sont d'autant plus anciens qu'ils sont plus 
simples, d'autant plus résistants à la théologie qu'ils ont 
un caractère de généralité et d'abstraction plus grandes. 
Chacun reconnaîtra ici que ce sont les idées mathéma- 
tiques qui sont appelées à former le berceau de la posi- 
tivité. 

Bien plus, leur présence, dans la mesure où il s'agit 
pour Comte de mathématiques essentiellement appliquées, 
constituant ainsi, dans le cas de la géométrie surtout, le 
mode le plus simple de l'existence inorganique, marque 
l'introduction d'un modificateur graduel de la philosophie 
primitive, d'un principe de dissolution pour les croyances 
théologiques ou métaphysiques, sûr, efficace, mais dont 
l'action est, pour ainsi dire, plutôt intermittente que conti- 
nue, justement parce qu'il n'est pas toujours accordé aux 
conditions sociales qui l'entourent. 
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Avec Thalès, Pythagore, Hipparque et Archimède 
— Archimède surtout, dont l'intérêt pour les applications 
pratiques préfigure l'idée des immenses services que la 
science devait rendre un jour à l'industrie — l'esprit scien- 
tifique s'était développé avec une telle plénitude qu'il 
suscite pour la philosophie de l'histoire une question 
caractéristique : comment expliquer que les dispositions 
éveillées n'aient pas été immédiatement mises à profit 
et qu'un intervalle de quinze siècles sépare l'élaboration 
astronomique d'Hipparque des découvertes de Kepler, 
pour ne prendre que cet exemple ? Ni les situations histo- 
riques, ni les mérites personnels ne renferment l'expli- 
cation. La recherche de celle-ci nous renvoie à la théorie 
complexe des facteurs dominants, celle de la présidence, 
de la souveraineté, de l'ascendant de certains caractères 
sociaux. L'évolution scientifique dépend de tout l'essor 
mental, et celui-ci peut comporter des éléments incompa- 
tibles entre eux qui obscurcissent l'horizon de la science. 
Un horizon jamais disponible à l’état pur, multiplement 
connexe, multiplement compact, suffisamment mobile 
pour ruiner toute prétention à l'absolu, sans jamais assu- 
jettir ce qui est scientifiquement établi à une histoire 
purement arbitraire. Car le progrès est toujours maturité 
et développement de l'expérience, habité dès l'origine 
par des lois logiques, essentiellement invariables, com- 
munes à tous les temps et tous les lieux, et même aux 
sujets quelconques. 


L'apport des sociologies de la connaissance 


Les travaux des sociologues classiques qui se sont 
intéressés aux formes de la connaissance restent, pour ce 
qui concerne les mathématiques, bien en decà de la pro- 
fondeur des vues de Comte. Ainsi, le philosophe 
Jérusalem, qui a créé l'expression « sociologie du 
savoir » et plaidé pour une étroite dépendance du 
social et du pensable, n'a fait que traduire en termes socio- 
logiques le langage transcendantal. 

Le grand Durkheim lui-même est, à certains égards, 
en retrait par rapport à Comte; en effet, il fait dériver la 
connaissance de la religion, perspective hasardeuse et en 
tout cas moins prudente que celle de Comte qui montre 
une présence simultanée, dès l’origine, d'éléments positifs 
et d'éléments antagonistes provisoirement dominants, 
évitant par là l'écueil d'avoir à dériver le savoir du social 
ou d'un de ses aspects. Par ailleurs, Durkheim, en suggé- 
rant la relation des catégories d'espace et de temps avec 
la structure sociale où elles sont produites, veut assigner 
une origine sociale à l'ensemble des catégories de l'enten- 
dement, c'est-à-dire aux concepts de genre, de nombre, 
de cause, de substance, par quoi il se rend tributaire de la 
théorie de la connaissance de Hamelin. Aussi sa sociologie 
véhicule-t-elle, quand elle se passe d'enquête empirique, 
les préjugés typiques d'une théorie de la connaissance 
bien datée. Enfin, et surtout, les mathématiques n'intéres- 
sent ni directement ni explicitement Durkheim, car cela 
n'avance à rien de dire que l'idée de nombre correspond 
aux propriétés les plus universelles de l'être. 

On pourrait attendre mieux de Lucien Lévy-Bruhl. 
Celui-ci, en effet, était plus sensible à la pluralité des 
genres de connaissance, et, dans sa dernière œuvre, à la 
diversité de leurs rôles dans différents types de société. 
On sait qu'il a d'abord soutenu la thèse de la loi de « parti- 
cipation mystique » comme substitut, dans les sociétés 
archaïques, des principes logiques ayant cours dans les 
sociétés « civilisées ». Par la suite, il a évolué vers l'idée 
d'une logique primitive spécifique, opposée à la logique 
développée sous la contrainte de la rationalité. Mais nulle 
part notre problème n'est envisagé pour lui-même, ni ne 
bénéficie des résultats recueillis. C'est pourquoi les autres 
efforts peuvent paraître également décevants. Une excep- 
tion cependant : les analyses de Max Scheler (1874- 
1928). 


La contribution de Max Scheler 

La connaissance mathématique est traitée sous la rubri- 
que générale de la connaissance scientifique; Scheler 
prend, le premier, ses distances à l'égard de la philosophie 
de la connaissance traditionnelle. Très proche du perspec- 
tivisme de Husserl, il considère, par exemple, que la table 
des catégories de Kant correspond simplement à la 
configuration conceptuelle qui a dominé l'Europe occi- 
dentale à un certain moment de son histoire. Il relativise 
tous les a priori subjectifs, c'est-à-dire tous les « sujets 


collectifs » qu'on imaginait au principe de la connaissance, 
échappant ainsi à la tentation de sociologiser le cogito, 
c'est-à-dire de substituer au sujet cartésien sur lequel se 
fonde le rationalisme classique un sujet collectif, le 
groupe et l'époque. L'intérêt principal de sa sociologie 
est l'analyse explicite de ce qu'il considère comme déter- 
minant l'essence de la science positive, laquelle doit son 
origine à la jonction de deux couches sociales séparées 
au départ mais condamnées à collaborer de plus en plus 
rationnellement : celle des contemplatifs libres et celle 
des hommes de métier et d'expérience. C'est la première 
qui garantit à la seconde le fondement méthodique, 
logique et mathématique; la seconde procure le rapport 
à la technique, à la mesure, à une expérimentation d'un 
type nouveau, échappant au hasard, impliquant une 
manipulation des corps et des forces naturelles familière 
en premier lieu aux cultures patriarcales expansives, à des 
sociétés organisées différemment des sociétés matriar- 
cales, introverties. 

L'attitude de Scheler consiste donc à refuser à la fois 
le pragmatisme, la conception de la science positive ou 
des mathématiques en particulier, qui en fait une science 
totalement issue de la technique, et la conception intel- 
lectualiste qui n'entend la relier qu'à la philosophie. 
Partout où il y eut science positive, c'est donc sur la base 
de l'association de la philosophie avec l'expérience du 
travail. Les formes des techniques de production et du 
travail humain correspondent aux formes de la pensée 
scientifique et positive sans que les unes soient les causes 
ou les effets des autres. La technique n'est pas la simple 
application d'une science pure qui la précède; car la 
volonté de puissance dirigée sur tel ou tel domaine déter- 
mine à l'avance les méthodes de pensée et d'intuition 
aussi bien que les buts de l'activité scientifique, mais elle 
les détermine de manière inaccessible à la conscience 
des individus, hors du champ de visibilité immédiate du 
chercheur ou du savant. 

Il y aurait donc lieu d'établir une typologie générale 
des systèmes de pensée qui se succèdent en reprenant 
chacun (et chacun à sa facon) des problèmes principaux 
qui se posent. Mais par là Scheler tend à se rapprocher de 
la théorie des visions du monde, chère à Dilthey, et 
trop compacte pour nous apprendre quelque chose de 
précis sur notre sujet. 

En effet, dire avec Scheler que la «volonté de puissance » 
habite la profondeur invisible du projet scientifique rend 
la mathématique elle-même, si pure qu'elle soit, à la réalité 
sociale où elle se forme : |’ « idéologie » habite fondamen- 
talement le savoir. Mais c'est là une vérité qui ne nous 
apparaît qu'à travers des analyses conceptuelles parfois 
trop abstraites pour être concrétisées, ou trop engagées 
dans la philosophie pour garder toute leur signification 
sociale. C'est sans doute la raison pour laquelle on ne 
trouve, en fin de compte, aucune analyse concrète des 
rapports entre mathématiques et société dans les tra- 
vaux de Scheler, ni, non plus, dans ceux de Karl Mannheim, 
celui qui fut lesociologue de la connaissance par ex- 
cellence. 


L'analyse de Karl Mannheim 

En effet, Karl Mannheim, parti d'une réflexion sur l'in- 
terprétation des œuvres culturelles, sur l'analyse struc- 
turale de la théorie de la connaissance et sur la problé- 
matique d'une logique de la philosophie, a développé 
sa théorie de la connaissance d'abord dans le cadre des 
problèmes inhérents à l'interprétation sociologique des 
œuvres, avec le souci de voir si l'examen peut mettre en 
lumière dans l'œuvre quelque chose qui échappe à 
l'ensemble des conditions sociales. Mannheim aperçoit 
la distance qui sépare l'individu de l'œuvre objective, 
qu'elle soit artistique ou scientifique. En France, L. Gold- 
mann et même J.-P. Sartre retrouvent la même réflexion 
sur la notion d'œuvre, mais ne considèrent guère plus que 
Mannheim les mathématiques en particulier, peut-être 
parce que là, plus qu'ailleurs, apparaît la fragilité de cette 
notion d'œuvre. Par ailleurs, Mannheim s'en tient à des 
questions de nature trop existentielle : Où sommes-nous ? 
Qu'est-ce qu'interpréter? Quelles sont les différentes 
formes de l'interprétation ? ou trop générale : Que veut 
dire « connaître »? Où en sommes-nous du devenir 
historique ? De quel lieu envisageons-nous notre univers 
intellectuel ? questions que leur résonance pathétique 
situe à leur tour tout à fait historiquement et socialement. 


L'analyse marxiste 

La philosophie marxiste, de Marx à ses interprètes 
récents, est restée plus fidèle à l'inspiration concrète, 
à l'analyse du procès de la connaissance réelle, non seule- 
ment en tant que fonction d'un ensemble de conditions 
historiques dont on définit la nature et les articulations, 
mais encore et surtout en tant que travail actuel élaboré 
sur la base des résultats de travaux effectivement dispo- 
nibles. Or, par ce biais, le marxisme tendait plutôt à élabo- 
rer une épistémologie concrète des mathématiques : la 
dialectique interne d'un mouvement singulier en tant 
qu'il est révélé, strictement parlant, par ce mouvement 
même. Une certaine autonomie du secteur mathématique 
s'affirme par là, et contredit la thèse générale d'Engels, 
pour qui la science est l'une des régions idéologiques 
supérieures, le besoin économique ayant été et n'ayant 
cessé de devenir davantage le « principal ressort du 
progrès de la connaissance de la nature »; les scientifiques 
s'imaginent seulement « qu'ils travaillent sur un terrain 
indépendant »; en réalité, tout en constituant un groupe 
autonome au sein de la division sociale du travail, tout en 
exerçant, en retour, une certaine influence sur le dévelop- 
pement social, voire le développement économique, ils 
n'en sont pas moins sous l'influence dominante de ce 
dernier. Cependant, toute la difficulté consiste à inter- 
préter, conceptualiser l'idée de cette « influence » qui, 
pour éviter toute connotation mystique, devra être disso- 
ciée en la possibilité de l'intervention des résultats 
scientifiques dans tel domaine économique et social, et, 
d'autre part, en pratique relativement autonome, avec 
une structure et une histoire propres. 

Telles sont les théories qui envisagent plus ou moins 
implicitement le problème des rapports entre les mathé- 
matiques et la société. Nous n'avons point considéré 
celles qui n'en traitent que de manière fort indirecte : 
celle de Max Weber, par exemple, sous la forme de la 
rationalité occidentale comme effet, au même titre que le 
capitalisme moderne, de l'éthique protestante. Et nous 
avons rencontré un certain nombre de questions qui 
auraient pu donner lieu à des enquêtes intéressantes sur 
les rapports des mathématiques et de la société aujourd'hui, 
mais toutes les théories dont nous avons parlé restent 
épistémologiquement en retard sur les mathématiques. 
Les indications que nous avons recueillies constituent 
donc les cases vides d'un programme inaccompli. 


L'impact mathématique sur le social 


Une réflexion plus actuelle s'avère donc indispensable. 
Aujourd'hui, en effet, la mathématique semble être deve- 
nue une préoccupation éminemment sociale, et de plu- 
sieurs manières : 

— en tant qu'elle est devenue un outil indispensable, 
bien qu'insuffisant, à toute science sociale ; 

— en tant que mode de savoir dominant de la société 
technologique; 

— en tant, enfin, qu'elle s'est imposée comme cons- 
tituant essentiel d'une nouvelle culture de base. 

Tout d’abord, la mathématique a conquis, il est vrai, 
le domaine social. La sociologie, par exemple, ne recourt 
pas seulement aux méthodes quantitatives pour l'analyse 
des données, mais à une foule d'outils mathématiques 
plus perfectionnés. 

Elle a ses origines propres. Elle ne semble pas résulter 
de la simple extension au social des méthodes qui ont fait 
leurs preuves dans les domaines de la nature. C'est 
pourquoi l’on ne trouvera pas à l'origine du projet d'une 
science sociale le souci de construire un concept abstrait 
de la « société ». Autrement dit, si c'est la sociologie 
empirique qui s'est le plus ouverte, et le plus utilement, 
aux mathématiques, le projet de cette sociologie embpi- 
rique existe tel quel dès l'apparition des premiers efforts 
pour comprendre les divers phénomènes aujourd'hui 
rangés sous la rubrique des sciences sociales. 


Histoire et valorisation idéologique 
de la mathématisation du social 


Les premiers essais pour introduire la quantification 
dans les sujets d'ordre social coincident avec la naissance 
de la science moderne du mouvement. Le même siècle 
a enfanté deux disciplines aussi différentes que la méca- 
nique et la sociologie quantitative. Certes, c'est, ici et 
là, le même besoin de maîtriser l'apparence désordonnée 
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en fondant une approche méthodique et réfléchie, d'une 
part, des phénomènes naturels, de l'autre, des phéno- 
mènes sociaux. Mais chacune de ces deux entreprises, 
qui n'eurent d’ailleurs pas un égal succès, mettait en 
œuvre une rationalité manifestement hétérogène à celle 
de l’autre. L'outil de la physique mathématique n'est pas 
celui qui sert à déterminer si un ensemble de données 
numériques, recueillies d'une certaine facon, permet de 
dégager une certaine régularité, sinon d'établir une nou- 
velle espèce de loi. 

La coïncidence historique de ces préoccupations d'orien- 
tation opposée décèle une intention de rationalité, qu'il 
serait peut-être imprudent de rapporter, comme à leur 
cause commune, à l'esprit du rationalisme montant. || se 
peut bien que cette rencontre ne fût pas l'œuvre d'un pur 
hasard mais, actuellement, aucune recherche ne permet 
d'en établir la nécessité de manière convaincante. 

Cependant, quelques faits bien établis révèlent cer- 
taines dépendances entre les préoccupations de ratio- 
nalité économique et sociale et certaines exigences 
mercantilistes : la création des systèmes d'assurances, 
l'organisation du crédit public, le recours aux dénom- 
brements démographiques, etc., toutes choses rendant 
indispensable un fondement numérique sûr et permettant 
d'établir un ordre financier rigoureux, de limiter le gas- 
pillage, de réduire le parasitisme social favorisé par les 
modes de vie plus anciens, de valoriser, enfin, le travail 
en y soumettant les princes eux-mêmes dont les fonctions 
devaient désormais être liées à des objectifs économiques 
précis. : 

La nouvelle dimension des États et leur inféodation 
à la conquête des premières richesses exigeaient donc 
une meilleure connaissance de leur situation démogra- 
phique et financière, et ont, par conséquent, directement 
commandé le développement de la statistique, comme 
science de l'État (Staatskunde), ainsi que le suggère le 
mot lui-même, introduit en 1749 par Achenwall, pro- 
fesseur à Gôttingen. Certes, en tant que simple désigna- 
tion de l'activité qui consiste à recueillir des données per- 
mettant de connaître la situation des États, les statistiques 
trouvent un ancêtre dans « la science des listes » si déve- 
loppée par les Sumériens qui ne négligeaient jamais 
de répartir par séries et par catégories les données de 
l'expérience, et plus encore, dans le recensement des 
productions agricoles qui remontent, en Égypte, à plus 
de 2 000 ans avant Jésus-Christ : les pharaons cherchaient, 
en effet, le moyen infaillible d'obliger tous les chefs de 
famille à payer les taxes individuelles et personnelles; 
plus récemment, le capitalisme des grands marchands de 
drap de Venise se dota d'une organisation rationnelle 
et d'une structure bureaucratique, qui a pu fournir un 
modèle aux Pays-Bas du XVII® siècle, où la renaissance 
du commerce s'est accompagnée d'un renouveau de 
l'enquête statistique attesté par les quelque soixante 
volumes des Respublica alzeviriana, où l'on trouve des 
informations sur l'économie des États. 

C'est bien au XVII® siècle que l'on peut trouver l'ancêtre 
direct de la statistique actuelle. Car c'est au XVIIE siècle 
que s'accuse le plus nettement le rapport profond entre 
la société et l'État. La définition de la statistique que 
retient Cournot, dans sa 7héorie des chances et des pro- 
babilités, nous montre rétrospectivement la conscience 
qu'on avait de ce rapport : « On entend principalement, 
nous dit-il, par statistique, comme l'indique l'étymologie, 
le recueil des faits auxquels donne lieu l’agglomération 
des hommes en sociétés politiques. en tant que ces 
faits sont susceptibles de dénombrement et d'évaluation 
numérique. » 

C'est Colbert, en France, qui avait ordonné des enquêtes 
fournissant toutes ces statistiques dont regorgent les 
mémoires des intendants. Le procédé devient systéma- 
tique, et comme un moyen de gouvernement. Et gra- 
duellement, la perception du socio-politique devient aussi 
peu commune et immédiate que celle des phénomènes 
naturels. Si bien qu'on peut bientôt dire des phéno- 
mènes socio-culturels ce que Newton disait des phéno- 
mènes naturels : « Le moindre fait qui s'offre à nos yeux 
est tel qu'on ne peut sans une extrême adresse démêler 
tout ce qui y entre, ni même sans une sagacité extrême 
soupçonner tout ce qui y peut entrer. » 

Mais si le lieu d'application originaire de la statistique 
est le domaine socio-politique, c'est d'avoir fonctionné 
comme /ieu d'application de la théorie des probabilités 
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qu'elle a eu un destin tout autre que celui des divers 
recueils de données sur la situation des États. 

Dans cette perspective, où les statistiques sont liées 
à des considérations probabilistes, on notera que, dès 1570, 
Cardan s'était intéressé aux statistiques relatives à la 
durée de la vie humaine; en 1693, l'astronome anglais 
Halley n'a pas dédaigné de publier une Bres/au Table 
of Mortality, première tentative d'établir une table des 
mortalités sur des données concrètes. Ces tables de 
mortalité furent un des premiers résultats à répandre le 
culte des déterminations numériques dans l’ordre socio- 
politique, comme le montre l'œuvre de Süssmilch (1707- 
1767) sur /'Ordre divin prouvé par la natalité, la mortalité 
et la fertilité du genre humain. L'engouement devient 
bientôt général : y participent non seulement les théolo- 
giens mais aussi les hommes de lettres et de sciences, et 
Buffon, par exemple, le justifie en alléguant que « de toutes 
les probabilités morales possibles, celle qui affecte le 
plus l'homme en général, c'est la crainte de la mort ». 
En fait, il est la marque du succès des premières statis- 
tiques médicales, commencées dès l'œuvre de Graunt 
(Natural and Political Observations Mentioned in à 
Following Index and Made upon the Bills of Mortality, 
1662), et se poursuivant tout au long du XVIIIe siècle, 
où apparaît justement dans la littérature la nouvelle 
rhétorique toute logique et toute rationnelle, fortement 
imprégnée du prestige des chiffres. 

Qu'on en juge par ce discours de Voitaire sur la prophy- 
laxie de la variole : « Il y a quelques gens qui prétendent 
que les Circassiens prirent autrefois cette coutume des 
Arabes; mais nous laissons ce point d'histoire à éclaircir 
par quelque savant Bénédictin, qui ne manquera pas 
de composer là-dessus plusieurs volumes /n-folio avec 
les preuves. Tout ce que j'ai à dire sur cette matière, c'est 
que, dans le commencement du règne de Georges ler, 
Me de Wortley-Montaigu.….. avec son mari en ambassade 
à Constantinople, s'avisa de donner sans scrupule la 
petite vérole à un enfant dont elle était accouchée en 
ce pays. Cette dame, de retour à Londres, fit part de son 
expérience à la princesse de Galles, qui est aujourd'hui 
reine. Dès qu'elle [la reine] eut entendu parler de 
l'inoculation ou insertion de la petite vérole, elle en fit 
faire l'épreuve sur quatre criminels condamnés à mort... » 

Suit l'argument fondamental aux yeux de Voltaire : 
« Sur cent personnes dans le monde, soixante au moins 
ont la petite vérole ; de ces soixante, vingt en meurent dans 
les années les plus favorables et vingt en conservent pour 
toujours de fâcheux restes : voilà donc la cinquième 
partie des hommes que cette maladie tue ou enlaidit 
sûrement. » 

La leçon à en tirer est qu’ « une nation commercante 
est toujours fort alerte sur ses intérêts, et ne néglige 
rien des connaissances qui peuvent être utiles à son 
négoce » (cf. la onzième lettre philosophique, sur l'inser- 
tion de la petite vérole). 

Voilà pourquoi Diderot, de son côté, déplore qu'on ait 
donné trop d'importance dans les écoles à l'étude des 
mots, alors que le spectacle de l'industrie humaine est en 
lui-même grand et satisfaisant pour développer « l'ins- 
tinct de la précision », pour faire sentir, dans les cas de 
probabilité, l'écart plus où moins grand par rapport au 
vrai, pour faire apprécier les incertitudes, « calculer les 
chances », faire sa part au sort; bref, c'est en ce sens, 
conclut Diderot, que les mathématiques deviennent une 
science usuelle, une règle de la vie, une balance uni- 
verselle. 

Le talent littéraire s'est donc lui-même mêlé de cette 
valorisation du nombre, de la quantité et de la statistique : 
d'où cet engouement, caractéristique du XVIII siècle, 
bien exprimé par Voltaire, ambitieux de réunir le titre 
de géomètre à celui de poète et d'historien; d'où l'admi- 
ration de tous pour Buffon, qui communique aux sciences, 
y compris l'arithmétique morale ou politique, le charme 
dont les lettres avaient eu jusque-là l'exclusivité. Il en 
résulte une certaine popularité des sciences en général, 
assez profonde en France où les meilleurs ouvrages sont 
écrits dans un style à la fois accessible et modèle, lors 
même que les ouvrages de Gauss ou de Newton demeu- 
raient écrits en latin. 

Cette pénétration de la littérature elle-même par la 
science et par ses applications marqua le point de départ 
d'une période qui vient à peine de s'achever, et dont la 
fin est saluée par les mathématiciens contemporains qui 


se félicitent que les mathématiques puissent aujourd'hui 
s'exposer avec une rigueur telle qu'elle exclut le genre 
d’ «exposé décoratif » qui permettait à certains de briguer 
à la fois l'Académie des sciences et l'Académie francaise ! 
C'est que ce prestige des mathématiques s'illustrait, en 
effet, plus par une précision excessive à laquelle se joi- 
gnait la passion du pittoresque, que par un souci d'objec- 
tivité et de rigueur. La mathématique offrait un arsenal 
de métaphores et de modèles pour concrétiser telle ou 
telle idée. Même Rousseau n'échappe pas à cette facon 
de faire, qui expose dans le Contrat social une théorie 
du gouvernement sur le modèle d'une théorie des pro- 
portions. 

Le désir d'étendre les mathématiques aux domaines 
appartenant à la société plutôt qu'à la nature existe donc 
réellement, surtout chez les premiers statisticiens. Mais 
ces efforts précurseurs ne dépassent pas le stade pré- 
scientifique : les enquêtes statistiques de ce temps res- 
pectent rarement les normes de l'enquête empirique telles 
qu'elles seront dressées plus tard, et suppléent le vide de 
l'information par l'audace des déductions. C’est pourquoi 
l'histoire de la quantification du social ne doit pas négli- 
ger les oppositions à la statistique. Celles-ci ont été expri- 
mées au cœur du XIX® siècle par A. Comte et réitérées 
par Claude Bernard, qui est sans doute allé plus loin dans 
la critique et la mise en valeur du ridicule des statistiques 
aveuglément appliquées, par exemple, dans le cas où 
l'on recueille l'urine d'un homme pendant vingt-quatre 
heures et qu'on mélange tous les échantillons pour avoir 
l'analyse de « l'urine moyenne » (on aura en effet l'ana- 
lyse d’une urine qui n'existe pas). Ce qui a rendu la sta- 
tistique inacceptable aux esprits les plus positifs, c'est 
précisément sa tendance à chiffrer n'importe comment, à 
quantifier sans méthode, si bien que Cournot, auteur du 
premier effort sérieux de mathématiser la théorie des 
richesses, pensait qu'un statisticien ou un financier ne 
peuvent guère être considérés comme des mathématiciens, 
et que nombres et mesures n'étaient pas forcément des 
mathématiques. C'est dire que /e besoin de gestion ou 
d'administration ne peut tenir lieu de fondement scienti- 
fique, ni de concept, ni de théorie, ni de légitimation 
philosophique, et si l'application des statistiques au social 
a peu à peu balayé les scrupules, c'est que le perfection- 
nement de la science a induit un raffinement de l'analyse 
des faits considérés. 


Amélioration des méthodes statistiques 
et utilisation de méthodes mathématiques 
non statistiques 


L'engouement pour les statistiques ne fera plus sourire 
à partir du moment où elles seront fondées sur le calcul 
des probabilités. Or, Adolphe Quételet (1796-1874) fut, 
à coup sûr, le premier à voir tout le parti que pouvait tirer 
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une « physique sociale » des travaux de Fourier et de 
Laplace sur la probabilité mathématique. D'abord intéressé 
par des moyennes et des taux pour des propriétés générale- 
ment d'ordre démographique, il étendit bientôt ses inves- 
tigations, vers 1840, à la distribution de ces propriétés, 
en se laissant guider par l'analogie qu'il remarquait entre 
la distribution de la taille et du poids des êtres humains 
et celle, mieux connue, des erreurs d'observation. C'est là 
une application anthropologique qui inspire encore 
aujourd'hui l'histoire quantitative lorsqu'elle étudie, par 
exemple, les archives de recrutement militaire. 

Mais l'œuvre de Ouételet restant dans l’ensemble assez 
confuse, et encore implicite quant à ses principes, susci- 
tera des critiques, dont les plus célèbres sont celles que 
lui adressa M. Halbwachs dans /a Théorie de l'homme 
moyen (1912). Lazarsfeld remarque à juste titre qu'en 
réalité c'est seulement après plusieurs décennies, avec 
le développement des « processus stochastiques », que 
le mouvement inauguré par QOuételet fut repris et que 
fut démontrée l'applicabilité du calcul des probabilités à 
ce que Halbwachs appelait le domaine de « l'interaction 
sociale ». 

Par exemple, la distribution binominale exprime la 
situation d'un bal où les hommes et les femmes, celles-ci 
étant en plus grand nombre, ne se connaissent pas : 
à l'ouverture du bal, chaque cavalier choisit une cavalière 
au hasard en tirant son nom au sort, et au bout de dix 
danses on peut ainsi classer les noms des danseuses 
selon le nombre de fois où elles ont été invitées. Or, si les 
cavalières choisies la première fois bénéficient de la 
croyance d'être les plus désirables, elles auront plus de 
chances d'être choisies, si bien que tout se passe comme 
si, dès la seconde danse, les noms des cavalières choisies 
la première fois étaient mis deux fois dans le chapeau. 
Si l'on répète l'expérience, le nombre des danseuses ayant 
eu le plus ou le moins de cavaliers croît sensiblement, 
tandis que le nombre moyen de succès demeure le même. 
Ainsi rien n'empêche le développement de processus 
stochastiques où les probabilités des choix individuels 
à l'instant { — 1 dépendent de la distribution totale de 
la probabilité à l'instant £. On ne peut en conclure, comme 
le fait Lazarsfeld, que Quételet avait raison contre 
Durkheim; l'acquis positif de chacun des deux points 
de vue semble aujourd'hui conservé, car il n'est pas dit 
que l’explicitation de la méthode de Durkheim dans son 
étude sur le suicide ne mène pas au même résultat que la 
systématisation des remarques de Quételet postulant 
qu'on peut mesurer l'inobservable si l'on suppose des 
relations mathématiques entre caractères observables et 
variables non observables, ou notant qu'on peut substituer 
une seule observation dans le temps portant sur une 
grande quantité de gens à des observations répétées 
sur une même personne. 
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< Le penseur prisonnier 
des algorithmes 
(vu par D. Ribas). 


Il a fallu attendre le début de ce siècle pour disposer 
d'une bonne méthodologie statistique, c'est-à-dire de la 
théorie qui permet, grâce à un concept convenable de 
l'inférence statistique, de passer des données observables 
à des conclusions sur les lois de probabilité qui régissent 
ces données. Autrement dit, il a fallu le développement 
de la statistique mathématique pour que le langage des 
sciences sociales lui-même puisse être remis en chantier, 
être passé au crible d'une conceptualisation critique et 
d'une redéfinition de ses notions opératoires. Ce dont 
témoigne bien la nécessité, vivement ressentie par Lazars- 
feld, d'analyser et de délimiter les objets empiriques, 
de clarifier et d'expliquer les termes, tâche de nature bien 
peu empirique, bien qu'elle soit inscrite dans le cadre 
d'une élucidation aussi précise que possible de l'enquête 
empirique. Celle-ci ne veut plus rester aveugle sur la 
jonction qu'elle effectue entre le langage dans lequel elle 
s'exprime, sur ses objets et les moyens qui permettent 
l'expression quantifiée. Tentative d'homogénéiser l'objet 
de l'enquête et son appréhension scientifique, de fixer 
les conditions de l'applicabilité des concepts retenus à 
certains ensembles d'éléments observables. Le carac- 
tère empirique des recherches de Lazarsfeld vient de la 
seule nécessité de repenser pour chaque cas une épis- 
témologie locale. De fait, l'ensemble des objets socio- 
logiques est considéré comme une combinaison de 
propriétés élémentaires de variables; un peu comme les 
corps sont réduits par Descartes à un espace homogène. 
Les relations entre variables sont une manière de mon- 
nayer, de développer les idées les plus complexes. Variable 
est, par exemple, la taille d'une ville, l'état financier d'une 
entreprise, le quotient intellectuel d'une personne, bref, 
tout ce qui se laisse mesurer d'une certaine facon. Il va 
sans dire que tout ne se traduit pas en « variable », avec 
toute la précision voulue. Mais cela permet des distinc- 
tions entre catégories de concepts, c'est-à-dire critères 
de classification donnés. Ainsi comprise, cette conceptua- 
lisation conforme pour ainsi dire les données des sciences 
du comportement, et donc des sciences sociales, aux 
exigences de la statistique mathématique. 

La construction de modèles statistiques, qui permettent 
une analyse de type causal, n'est pourtant pas l'unique 
voie empruntée par la mathématisation du social. Bien 
des situations réelles relèvent de modèles mathématiques 
plus complexes, par exempie les modèles stochasti- 
ques, plus propres à rendre compte des évo/utions d'une 
grandeur dans le temps, le hasard intervenant à chaque 
instant. Mais, dans l'état actuel du calcul des probabilités, 
les applications de la théorie des processus stochastiques 
au social restent assez limitées : l'analyse d'un modèle 
stochastique devient, en effet, très complexe, dès que 
les hypothèses qu'il exprime dépassent un niveau simple: 
en particulier dès que le nombre de variables intervenant 
dans le modèle dépasse un certain ordre, assez petit. 

Bien que les statistiques aient permis de traiter mathé- 
matiquement des notions que d’aucuns croyaient réfrac- 
taires par nature, elles ne constituent certes pas le seul 
traitement mathématique possible des phénomènes 
sociaux. On connaît ainsi un exemple d'application des 
probabilités ayant un fondement étranger à toute préoc- 
cupation statistique. Condorcet a créé, en effet, Une science 
sociale mathématique sur la base d'une philosophie 
sociale contractualiste, fondée sur les notions de volonté 
et d'intérêt généraux. Cette idée, qui est aussi celle de 
Locke, de Rousseau, de Diderot, implique une concep- 
tion de la conduite humaine en termes de décision et 
de choix : toute forme de décision collective, tout suffrage 
peuvent être considérés comme l'agrégation de volontés et 
d'intérêts particuliers. Le suffrage, qui est ainsi fondamen- 
tal, implique que le vote est un pari. Se pose alors une 
question : comment éviter au parieur les inconséquences 
possibles de son choix? Ce que les sociologues nomment 
l'effet Condorcet montre que l'agrégation de jugements 
raisonnables donne naissance à des jugements déraison- 
nables et que la notion de volonté générale n'est pas si 
claire qu'on le croit à première vue. Le traitement mathé- 
matique de cette difficulté débouche sur deux catégories 
hétérogènes de problèmes : la définition d'une mesure 
d'utilité par une mesure de probabilité, et la construction 
d'un modèle d'homme rationnel dont on retrouverait 
le comportement dans les comportements spontanés. 

En outre, chacun sait aujourd'hui que mathématiser 
n'est pas nécessairement quantifier, ce qui signifie ici que 
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la capacité des mathématiques à servir d'instrument aux 
sciences humaines n'est pas toute concentrée dans la 
théorie des probabilités, avec ou sans l'auxiliaire des 
statistiques. 

L'analyse des structures algébriques a eu une fortune 
qui a largement dépassé le domaine de l'algèbre; de 
CI. Lévi-Strauss à Piaget, en passant par une multitude 
de travaux de linguistique et de sociologie, c'est le langage 
commun d'une mathématique de la structure qui domine, 
au point qu'on n'est pas loin d'espérer que les sciences 
de l'homme deviennent une branche des mathématiques 
appliquées. L'algèbre des structures fournit pour le moins 
des modèles, c'est-à-dire des représentations schémati- 
ques permettant l'étude d'un ensemble de questions, 
même si, comme c'est le plus souvent le cas, elles n’entre- 
tiennent pas de lien de signification naturel avec ces 
questions. La meilleure illustration de ce procédé est 
certainement fournie par l'étude des systèmes de parenté 
dans les sociétés archaïques : on se reportera, bien entendu, 
à la fameuse contribution, dans les Structures élémentaires 
de la parenté de CI. Lévi-Strauss, d'André Weil, qui montre 
comment la théorie des groupes de substitution facilite 
la classification des lois du mariage dans la société 
Murngin (cf. chapitre XIV). L'analyse structurale des 
relations de parenté est fructueuse, précisément parce que 
la relation de parenté est éminemment sociale, mettant en 
jeu non pas deux ou trois individus isolés mais tout 
un ensemble plus ou moins grand d'individus, et à travers 
lui tout le groupe, c'est-à-dire toute l'organisation, toute 
la structure sociale. 

La maternité, par exemple, est une relation non seule- 
ment d'une mère à ses enfants mais aussi de cette femme 
à tous les membres du groupe, pour qui elle est épouse, 
sœur, cousine, etc. Elle définit un ensemble de droits 
et de devoirs, et, comme le remarque si justement Lévi- 
Strauss, son absence ne définit pas rien, mais elle définit 
l'hostilité. Le mariage n’est pas « un processus discontinu, 
qui tire de lui-même, dans chaque cas individuel, ses 
propres limites et ses possibilités »; les règles qui le 
régissent expriment la facon dont un groupe donné orga- 
nise l'échange et la circulation des femmes entre les 
différents segments de la société. 

Ce qu'il y a de plus social dans la société est donc suscep- 
tible d'être mathématisé. Non que l’on trouve dans la 
société l'équivalent de véritables quantités théoriques : 
dans le meilleur des cas, en économie par exemple, la 
quantification statistique n'atteint que des mélanges: 
mais elle permet, néanmoins, de poser des questions dont 
le langage ordinaire ne permet pas une formulation pré- 
cise. Par ailleurs, le recours de plus en plus courant 
aux modèles permet une exploration qui tient lieu, pour 
ainsi dire, d'expérimentation. 


Mathématique et technologie 


Il faut rappeler que cet accès progressif des phéno- 
mènes sociaux au traitement mathématique s'est fait 
dans une société qui se transformait parallèlement jusqu'à 
se muer en support d'une pensée essentiellement tech- 
nologique, expression ultime de l'exigence de rationa- 
lité. Le terme technologica a d'abord désigné une doctrine 
de la division des disciplines, de leur classification; des 
acceptions proches du sens moderne apparaissent à la 
fin du XVIIE siècle ; par exemple, chez C. Wolf, il désigne 
déjà une science des métiers et de leurs produits. 

Le premier représentant moderne de cette exigence, 
Descartes, concevait à la fois le monde comme un monde 
mathématique (qui ne contient qu'étendue et mouve- 
ment) et la science comme le moyen de s'en rendre maître. 
Désormais, l'expérience ne sera plus, comme dans 
l'Antiquité, aux antipodes de la spéculation; ayant elle- 
même changé de nature, son statut s'est modifié : conduite 
à l’aide d'instruments qui sont, selon une formule connue, 
des « théories matérialisées », elle s'est de plus en plus 
pénétrée de théorie. Cette tendance s'est accentuée à par- 
tir de la Révolution française : la perception humaine a 
définitivement troqué les sens pour les instruments. 
Dès 1794, Lakanal proclamait que sans mathématiques 
l'architecture civile et militaire n’a plus de règle et les 
sciences de l'artillerie et des fortifications plus de fonde- 
ment. Et Monge de préciser qu'il faut orienter l'éducation 
nationale vers la connaissance des objets qui exigent 
de l'exactitude, vers les théories qui permettent des 


applications précises. C'est le développement d'un nou- 
veau modèle du savoir (les sciences appliquées), et 
l'exigence de nouvelles écoles (École centrale des travaux 
publics [1797]), où s'enseignent les mathématiques et la 
physique en vue de la diversité de leurs applications. 
Cournot remarquait que l'homme a fini par préférer à la 
machine naturelle, le cheval avec les images poétiques 
qu'il éveille, le cheval-vapeur de l'industrie moderne, qu'il 
a pu construire sur un plan plus simple, dont il peut mieux 
régler le service et contrôler la dépense. Dans ce but, il 
s'est fié de plus en plus aux mathématiques. 

Cette technologie s'est étendue aujourd'hui sans cesser 
de nourrir un rapport profond aux sciences de la précision, 
c'est-à-dire plus ou moins directement aux mathématiques. 
Elle est l'application systématique des sciences, et 
fonde la possibilité de concrétiser le savoir sur une stratégie 
de la division et de la spécialisation extrêmes des tâches, 
caractéristiques qui sont, à leur tour, marquées par la durée 
des processus de fabrication exigeant une multitude de 
compétences généralement séparées. D'où le rôle, dans 
la civilisation technologique, de la recherche et de la p/ani- 
fication. On n'en est plus à savoir calculer un certain 
nombre de forces physiques de l'Univers, mais à vouloir 
décupler, et défier en même temps ces forces; la concur- 
rence internationale contraint à cet effort gigantesque si 
l'on prétend maîtriser l'espace, évaluer les matériaux dispo- 
nibles, contrôler le savoir qui permet de transformer toutes 
ces données en autant de ressources. 

Non seulement les mathématiques se sont imposées 
dans plusieurs disciplines longtemps réputées réfractaires, 
non seulement elles constituent un élément de base dans 
la société technologique industrielle d'aujourd'hui, mais 
encore, elles prétendent à une place de choix dans Ja 
culture actuelle. On est loin de l'époque où A. Comte se 
plaignait de la domination des Académies par les géo- 
mètres. On est loin de la mise en garde de Cournot contre 
la confusion du règne des chiffres, des nombres et des 
mesures avec celui des mathématiques. Il est désormais 
entendu que toute recherche sérieuse recourt d'une façon 
ou d'une autre aux mathématiques. La vieille bataille entre 
le latin (et le grec) et les mathématiques dans la formation 
des élèves n'a plus de raison d'être, car elle a été définiti- 
vement gagnée. Les mathématiques apparaissent comme 
le lieu où l'on peut disposer de toutes les formes possibles 
de discours, des discours fondamentaux qui sont à la racine 
de la mécanique, de la physique, de la biologie (il faut 
un baccalauréat de la série C pour des études de médecine), 
de la psychologie, de la sociologie, de la linguistique, etc. 
On apprend ainsi à raisonner sur tout en toute rigueur, 
à se méfier des idées sans expression immédiatement claire, 
à couler sa pensée dans le moule du raisonnement mathé- 
matique. Et surtout, celui qui est formé par l'activité 
mathématique laisse plus spontanément les généralités 
aux spécialistes de la politique pour accepter la sécurité 
intellectuelle que procure une discipline reconnue. Or, 
cette attitude est plus rentable pour une société techno- 
logique, qui divise et décompose tout problème en seg- 
ments multiples dont chacun constitue le domaine d'inter- 
vention d’un expert. Les contraintes de l'industrie et, 
en dernier ressort, le marché du travail renforcent la pré- 
férence pour la culture mathématique. Mais cette pré- 
férence est une préférence dictée; c'est le résultat de la 
contrainte sociale, d'un fait social au sens plein du terme, 
qui impose, comme eût dit E. Durkheim, « des manières 
d'agir, de penser et de sentir extérieures à l'individu, et 
qui sont douées d'un pouvoir de coercition en vertu 
duquel elles s'imposent à lui », sans avoir ni la nécessité 
des faits logiques ni le caractère naturel de ce qui s'enra- 
cine dans l'organique, ni le caractère personnel propre aux 
représentations psychologiques. 

L'existence de ce fait social légitime l'effort de faire 
une véritable sociologie des mathématiques, que nous ne 
prétendons pas développer entièrement mais en vue 
de laquelle nous voulons faire les remarques, à caractère 
programmatique, qui suivent. 


Réflexions pour une sociologie 
des mathématiques 


Une sociologie des mathématiques ne saurait être 
considérée comme un appendice à la sociologie de la 
connaissance générale, qui est l'étude des formes de 


connaissance propres à chaque société ou à chaque 


groupe, et qui repose sur une notion trop générale pour 
être opérante dans une enquête restreinte. Mais on ne 
saurait non plus l’assimiler à une sociologie de la science, 
d'une part parce que les rudiments déjà disponibles de 
cette sociologie ne considèrent pas les mathématiques 
comme un secteur particulier digne d'une recherche de 
ce genre, d'autre part parce que sous la rubrique « socio- 
logie des sciences », qui recouvre un vaste domaine, 
depuis une sociologie de la sociologie elle-même à une 
sociologie de la communauté savante, on ne considère 
généralement que les sciences où l'impact social est 
facile à déceler, en raison des services multiples qu'elles 
rendent directement à la société industrielle. Or les mathé- 
matiques pures restent un peu à part, du fait qu'elles 
ont une autonomie relative par rapport à la société, et 
nous allons préciser en quel sens pour éviter tout malen- 
tendu. 


Rapports des mathématiques aux formes sociales 


La préhistoire et l'Antiquité 

En mathématiques, l'investigation peut être comprise 
sans qu'il soit nécessaire de recourir à un point de départ 
empirique. Ni l'observation des faits, qu'ils soient fortuits 
ou produits, ni l'émission d'une idée ou d'une hypothèse 
ne constituent des considérations propres à éclairer l'acti- 
vité de recherche du mathématicien. L'opinion qui place 
l'empirisme, c'est-à-dire l'observation ou l'expérience 
fortuite, à l'origine de toutes les sciences, se rencontre 
encore aujourd'hui, sous une forme raffinée certes, et 
s'exprimant par des moyens on ne peut moins empiriques 
il est vrai, comme le monirent les travaux de certaines 
tendances de l'école analytique des dernières décennies. 
L'empirisme le plus intégral ne peut, cependant, méconnai- 
tre le statut du formel : aussi la mathématique, ne pouvant 
procéder de l'expérience, se voit-elle reléguée dans une 
sphère de pur formalisme, après quoi se pose évidemment 
la question de la fécondité d'une science purement 
formelle ! 

Une sociologie des mathématiques ne peut avoir pour 
but de fonder les mathématiques ou d'en donner une expli- 
cation ultime. Il ne peut être question pour elle d'assumer 
ce projet philosophique au moment où les mathématiques 
ne s'’embarrassent plus d'aucune vue systématique ni 
d'aucune philosophie! Par ailleurs, une fondation sociale 
de cette science pourrait tout simplement balancer dans la 
contradiction ou le paradoxe une activité dont le premier 
but est de s’en garder. En mathématiques, le sociologisme 
est aussi peu à sa place que le psychologisme; il n'y a pas 
de genèse sociale, pas plus qu'il n'y a de genèse psycholo- 
gique de la mathématique. 

L'histoire des mathématiques montre qu'à tel moment 
donné, tous les résultats ne connaissent pas une égale 
fortune : certains restent en friche, tandis que d'autres, 
favorisés par une vive curiosité ou un grand intérêt social, 
sont aussitôt exploités. Par ses encouragements, la société 
peut ainsi jouer un rôle moteur, susciter le développement 
ou favoriser le plein épanouissement d'une science dont la 
facture interne ne reflète pas immédiatement les besoins et 
les passions sociales. 

Examinons les choses d'un peu plus près. L'archéologie 
nous apprend qu'il n'y a probablement pas eu, avant 
l'Age du bronze, de pratique mathématique diversifiée, 
bien que l’on ait connu dès la fin du Néolithique des rudi- 
ments de calendrier et certaines figures géométriques. 
Remarque dont il faut souligner le caractère approximatif, 
en rappelant l'absence d'une histoire unique pour toutes 
les aires culturelles, et le fait que ce qui est découvert 
ici vers 3500 avant J.-C. n'apparaît ailleurs que vers 500. 
L'Age du bronze produit donc un calendrier plus précis, 
des rudiments d'arithmétique, de géométrie, d'astro- 
nomie, mais c’est aussi l’âge où apparaissent la propriété 
privée, la société de classes, et surtout une classe dis- 
tincte de celle des paysans et des artisans, la classe des 
scribes. L'époque suivante connaît l'alphabet, mais voit 
également apparaître la classe des commerçants et 
des formes politiques plus élaborées; autrement dit, on 
assiste au développement du secteur de l'échange et de 
celui de l'administration; l'alphabet consacre l'écriture, 
et l'écriture crée, dit-on, l'histoire. 

Considérons le cas de l'Égypte : sa population apparaît 
dès le Néolithique; ses outils sont en pierre polie, elle 
connaît la poterie, la vannerie, le tissage, le travail du cuir, 
du bois et de l'os; elle a domestiqué le bœuf, le mouton, 
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égyptien indiquant 

la méthode de calcul 

du volume d'un réservoir 
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A droite, 
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(représenté en 

une double figuration 
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médiéval), la géométrie 
prend un aspect d'une 
beauté toute particulière 
et d'un enchaînement 
logique. 


la chèvre, et cultivé le blé et l'orge, d'où une première 
organisation sociale. Après le Néolithique, les céramiques 
témoignent d'un sens géométrique, telle cette céramique 
qui présente sur fond rouge poli un décor géométrique 
peint en blanc. 

Ailleurs, en Abyssinie et en Mésopotamie, on remarque 
une évolution similaire, mais les spécialistes refusent de 
parler d'influence. Cette évolution, en tout cas, trahit 
un perfectionnement des techniques qui a transformé 
l'artisan en artiste : une première division du travail lui a 
sans doute permis de développer, en se consacrant exclu- 
sivement à son travail, un goût esthétique, un sens du 
parfait qui prévaut sur le sens de l’utile et approche l'idée 
d'objet d'art. A l'époque où existe une division technique 
du travail qui est, en raison de l'importance religieuse du 
calendrier, une division sociale du travail, apparaissent 
également des notions fragmentaires d'arithmétique et 
de géométrie. Entre les mains d'une caste, celle des scribes, 
l'art de calculer, d'abord lié à la métrologie habituelle 
(mesüre des longueurs, des volumes, des poids, etc.), 
aux nécessités vitales de l’agriculture (prévision des crues 
du Nil, restitution des frontières des terrains détruits par 
l'inondation), enfin aux exigences de la vie administra- 
tive, tel l'établissement juste d'une assiette de l'impôt, 
s'est développé sans s'arracher aux préoccupations uti- 
litaires et empiriques qui semblent l'avoir suscité. Les 
scribes, déjà au fait des techniques de rédaction, se 
chargent des techniques de calcul et de mesure, produit 
d'un travail appliqué mais autonome, déjà spécialisé, qu'il 
est difficile de remiser dans l'expérience au sens de 
l'empirisme traditionnel. 

Le fait n'a pas échappé à Aristote qui, nonobstant le style 
archaïque, a su l'apercevoir, mieux que tous ceux qui, 
pour défendre l'originalité absolue du miracle grec, n'ont 
pas voulu accorder à l'Égypte ce que le grand philosophe 
grec lui reconnaissait volontiers : qu'elle a été « le berceau 
des arts mathématiques, car on y laissait de grands loisirs 
à la caste sacerdotale ». Les arts mathématiques sont donc 
nés dans les contrées « où régnait le loisir », c'est-à-dire 
où certains travailleurs pouvaient se consacrer à une acti- 
vité qui ne répond pas immédiatement aux nécessités de 
la vie. La caste des scribes n'était directement soumise 
qu'à l'administration et à la religion! 

Les techniques de calcul et de mesure ont donc un 
certain caractère officiel, que l'on retrouve, plus accusé 
encore, dansles remarquablesréalisations chinoises, carac- 
térisées, pour ce qui concerne les mathématiques, par 
la prédominance de la pensée algébrique. En Chine, plus 
qu'ailleurs, le développement d'une bureaucratie au ser- 
vice de l'appareil d'État, pour organiser l’ensemble de la 
production et diriger la main-d'œuvre dans les travaux agri- 
coles et de construction, une bureaucratie bénéficiant 
d'un « charisme impérial » à la mesure de son efficacité 
dans l'organisation sociale, semble avoir joué un rôle 
décisif dans la formation de la pensée mathématique. La 
société chinoise ancienne n'est pas fondamentalement 
esclavagiste, et, à la différence de la société égyptienne, 
prompte à utiliser massivement la force humaine, utilise 
plutôt des moyens techniques, telle la voile pour la pro- 
pulsion des bateaux. Mais l'autorité centrale ne s'exerce 
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qu'avec le concours des savants qui se trouvent aux com- 
mandes et cherchent à tirer parti du cours naturel des 
choses en intervenant aussi peu que possible dans les 
affaires de la société. Cette conception non intervention- 
niste dans le champ de l’activité humaine aurait dû favori- 
ser le développement des sciences de la nature. Mais, et 
c'est là la limite de la science chinoise, la pérennité de la 
féodalité bureaucratique, qui se conserve sans change- 
ment, peut avoir constitué un obstacle à l'association des 
mathématiques avec l'observation empirique. La science 
chinoise n'accomplit pas le saut qualitatif qui s’accomplira 
dans la science occidentale, où l'expérimentation, exi- 
geant l'intervention active du savant, scellera à partir 
de Galilée une association décisive avec les mathé- 
matiques. 

On ne peut évidemment pas dégager ici toutes les corré- 
lations possibles, pour chacune des grandes formes de 
vie collective, entre le développement d'une certaine 
mathématique et la présence de certains facteurs dans 
l'organisation sociale. Mais le peu que nous en avons dit 
montre la faiblesse des facteurs anthropo-physiques, 
raciaux ou intellectuels devant les facteurs sociaux. 
Malheureusement l'étude sociologique ne peut être menée 
qu'avec une extrême prudence et un sens très vif des 
nuances, et ses résultats auront difficilement la forme 
d'énoncés catégoriques, car rien ne serait plus hasar- 
deux, comme nous l'avons déjà fait remarquer, qu’une mise 
en parallèle de la progression en mathématiques et des 
formes sociales qui impliquerait un découpage aussi 
dogmatique qu'intellectuellement fragile. 

Que les sciences mathématiques les plus abstraites se 
soient épanouies dans la Grèce antique, c'est sans doute 
parce que le loisir des uns a permis de dégager l'activité 
mathématicienne des pratiques directement commandées 
par la vie religieuse, commerciale et technique. Ce qui 
explique, notamment, l'attribution aux mathématiques 
de qualités esthétiques indépendantes, d'un genre de 
beauté particulier, effet des rapports d'ordre, de proportion 
et d'harmonie qu'y découvre un Pythagore, capable de 
voter une hécatombe le jour où il aperçoit, sans le secours 
d'aucun arpenteur, la relation qui lie les trois côtés d'un 
triangle rectangle. Ce caractère répond à des facteurs 
d'ordre sociologique, dont une fiction pourra indirecte- 
ment montrer l'importance : imaginons Monge, par exem- 
ple, expliquant ses procédés de géométrie descriptive à 
quelque architecte des temples d'Agrigente ou de Sybaris, 
contemporain de Pythagore, qui n'aurait vu dans cette 
géométrie, si décisive pour le XIX£ siècle européen, qu'un 
artifice ingénieux, trop particulier à l'homme, à son indus- 
trie, aux instruments matériels dont il dispose. 


Le tournant du XVII: siècle 
On voit, par contraste, le caractère éminemment social 
des mathématiques d'aujourd'hui, héritières de celles 


qu'un certain état de l'Europe à la fin du Moyen Age a 
rendues possibles : une liaison spécifique entre les mathé- 
matiques et l'expérience, plus précisément une mathémati- 
sation des hypothèses de l'expérience qui a mis celle-ci 
sous le contrôle de celles-là, a permis de lier le sort des 
mathématiques à celui de la physique et de les transformer 


en magasin d'outils anticipatoires exigés par les différents 
laboratoires techniques. Si l'on veut éprouver la teneur de 
cette thèse, le concept de « formation du capitalisme 
moderne » se présentera naturellement à l'examen, et dans 
l'acception étendue que l'expression a invinciblement 
acquise depuis le début de ce siècle, à savoir celle d'une 
rationalité moderne, dont les causes multiples et variables 
ont été diversement commentées. Ce qui est certain, 
c'est que les mathématiques pures d'aujourd'hui résul- 
tent d'un effort de rigueur et de précision soutenu tout au 
long du XIX® siècle, centré sur l'analyse, qui est née de 
l'inspiration physique et mécanique présente depuis la 
coupure galiléenne. Engels avait raison de dire qu’ « en 
introduisant les grandeurs variables et en étendant leur 
variabilité jusqu'à l'infiniment petit et à l'infiniment grand, 
les mathématiques aux mœurs si austères ont commis le 
péché », si l'on entend par là qu'elles se sont ouvertes à 
une histoire. 

Après quoi la validité de leurs démonstrations sera à 
revoir; un nouveau système sera nécessaire pour donner 
aux nouvelles notions un statut logique indépendant du 
sens qu'elles ont en naissant. Mais du point de vue d'une 
sociologie historique, la période caractéristique des 
mathématiques est bien ce siècle qui, en étant celui de 
Galilée et de Descartes, fut celui de la navigation outre- 
mer, du négoce entreprenant, des sciences physiques, des 
premières statistiques importantes, celui du début de la 
mécanisation de l'industrie et des principaux phénomènes 
spécifiques de la civilisation industrielle. 


Le scientisme actuel 

Aussi est-ce avec raison que mathématiciens et non- 
mathématiciens à la fois insistent sur les succès specta- 
culaires de la méthode expérimentale pour expliquer 
l'impact des mathématiques sur la vie sociale et quoti- 
dienne. Si bien que quiconque veut être de la société 
moderne, où moderne tout court, qu'il soit homme d'af- 
faires, politicien, ou linguiste, doit disposer d'un bagage 
mathématique suffisant pour être à l'aise dans la langue 
des chiffres. Ce phénomène, né dans une société donnée, 
est entretenu par la publicité faite aux mathématiques par 
une idéologie propre : le scientisme, nouvelle religion 
servie par les prêtres respectés que sont les scientifiques, 
les technocrates, les experts, unanimes à réagir à « toute 
attaque contre cette religion, ou l’un de ses dogmes, ou 
l'un de ses produits, avec toute la violence émotionnelle 
d'une élite régnante aux privilèges menacés ». 

Cette élite, remarque encore A. Grothendieck que nous 
venons de citer, s'identifie intimement aux pouvoirs en 
place qui s'appuient fortement, en retour, sur ses compé- 
tences technologiques et technocratiques. C'est elle qui 
porte et propage l'ensemble des mythes qui forment le 
credo scientiste : que seule la connaissance scientifique 
est véritable, réelle, objective, universellement valide ; que 
tout ce qui peut être exprimé sous forme quantifiée et 
produit dans des conditions expérimentales déterminées, 
est objet de connaissance scientifique; que toute la 
réalité doit se laisser exprimer par des modèles mécani- 
ques ou formels, analytiques en tout cas; que la connais- 
sance doit être pulvérisée en districts spécialisés où 
seuls interviennent et jugent ceux qui en sont les spécia- 
listes et les experts ; que science et technologie sont capa- 
bles de résoudre les problèmes de l'homme; enfin, que 
les experts seuls sont en mesure et méritent d'appartenir 
aux instances de décision. 

Ainsi la mathématique n'est pas seulement descendue 
dans l'arène sociale, elle remplit directement une fonc- 
tion sociale. Et d'abord par le biais de la technologie, ce qui 
se traduit dans le rôle de l'ingénieur et du technocrate 
dans notre société. Personnages issus probablement des 
bâtisseurs de cathédrales, qui semblent bien avoir été les 
premiers à réunir connaissance scientifique et connais- 
sance technique, qui ont, les premiers, permis aux patrons 
de ne plus conduire personnellement leurs travaux et 
qui ont scandalisé, dès cette première apparition, Nicolas 
de Biard écrivant en plein XIII® siècle : « Dans les grands 
édifices, il y a un maître principal qui les ordonne seule- 
ment par la parole, mais n‘y met que rarement ou jamais 
la main, et cependant il reçoit des salaires plus considé- 
rables que les autres. Les maîtres des maçons ayant en 
main la baguette et les gants disent aux autres Par ci me 
faille, mais, eux, ils ne travaillent et cependant ils reçoi- 
vent une plus grande récompense. » Ou plutôt ils tra- 


Vaillent autrement et constituent les premiers spécialistes 
auxquels on fait appel, parfois de fort loin. 

Cette situation d'imbrication mutuelle entre des exi- 
gences nées dans des domaines aussi hétérogènes que 
celui de la mathématique et celui de la vie sociale est 
propre à expliquer la nature psycho-sociale des para- 
digmes que Thomas Kuhn présente dansson essai Structure 
des révolutions scientifiques : à tel moment tel secteur 
scientifique s'impose comme sommet et guide des recher- 
ches poursuivies sous l'effet des contraintes qu'impose 
la société. Ce qui n’est possible que parce que le scienti- 
fique, fût-il pur mathématicien, est d'emblée, à sa nais- 
sance, mêlé, voué au service social, ainsi que l'exprime 
le souhait des classiques, de Descartes entre autres, 
lorsqu'il déclare : « Pour ce qui est des expériences qui 
peuvent y servir, un homme seul ne saurait y suffire à les 
faire toutes; mais il ne saurait aussi employer utilement 
d'autres mains que les siennes, sinon celles des artisans, 
ou telles gens qu'il pourrait payer, et à qui l'espérance du 
gain, qui est un moyen très efficace, ferait faire exacte- 
ment toutes les choses qu'il leur prescrirait » (Discours de 
la méthode, VI® Partie). 


L'impact de l'État 


Or, le lien de la mathématique à la société est aujour- 
d'hui plus profond que jamais, le savant dépendant 
lui-même d'une instance de décision qui lui commande de 
travailler dans le sens d'une mathématique significative, 
c'est-à-dire utile à la société industrielle. C'est dans ce 
sens assurément que se fait l'évolution, comme le montrent 
les informations les plus récentes : 

Nous apprenons qu'à l'occasion du 20° anniversaire 
de l'Académie, L. Brejnev a déclaré aux savants russes : 
« Nous n'avons pas l'intention de vous dicter les détails des 
thèmes scientifiques, les voies et les méthodes de la 
recherche. C'est l'affaire des savants eux-mêmes. Mais 
quant aux orientations essentielles du développement de 
la science, quant aux tâches principales rendues néces- 
saires par les réalités, nous les déterminerons ensemble. » 
Autrement dit, les experts doivent réaliser des programmes 
dont ils ne décident qu'à titre, au plus, de conseillers. 

La situation n'est guère différente ailleurs. En France, 
le gouvernement a décidé une série de réformes de struc- 
ture visant la coordination technico-sciertifique ; désor- 
mais « les laboratoires élaboreront des programmes, mais 
c'est le gouvernement qui disposera, en s'aidant de comi- 
tés consultatifs et de la Délégation générale à la recherche 
scientifique et technique ». 

L'inféodation à l'État-Patron et aux sociétés industrielles 
« intègre » la vie scientifique à la vie économique. Elle 
consacre une dépendance étroite des sciences, et en pre- 
mier lieu des mathématiques, envers la société. C'est 
ainsi que les mathématiques dites «modernes » ne sont pas 
dénuées d'attaches idéologiques spécifiques ; René Thom 
a souligné, par exemple, que l'esprit bourbakiste, essen- 
tiellement algébriste, tend à faire passer dans l’enseigne- 
ment les structures algébriques qui s'étaient révélées 
utiles dans les mathématiques récentes, en vue d'une for- 
mation mathématique accessible à des hommes ordi- 
naires, qu'on informe minutieusement, et qu’on mène, au 
moyen d'un enseignement approprié, à faire en sorte que 
leurs connaissances se combinent avec celles de spécia- 
listes d'autres branches, également ordinaires, pour pro- 
duire l'immense littérature fabriquée dans les départe- 
ments de mathématiques, équivalents sobres des labo- 
ratoires de physique. 

Les mathématiques n'ont donc pas servi seulement à 
rationaliser l'étude des secteurs sociaux. Par le biais de la 
technologie et des exigences de la société industrielle 
avancée, elles se trouvent au principe même de la société. 
Au point que celle-ci, pour en produire, se dispense des 
génies, et se suffit des hommes ordinaires, convenable- 
ment formés ! Qu'est-ce à dire sinon que la mathématique 
n'est pas le produit d'idiosyncrasies individuelles — et 
l'a-t-elle jamais été ? Programmes, groupes de recherches, 
autant d'expressions qui nous rappellent que la mathé- 
matique est tombée dans la perspective sociale. Les pro- 
grammes impliquent des paradigmes qui définissent les 
problèmes à résoudre, et ces paradigmes définissent 
comme une tradition horizontale, où l'on n'imite point 
ses pères, mais les directeurs de programmes et de recher- 
ches, dépositaires des ultimes suggestions réalisables 
parmi toutes les suggestions scientifiquement possibles. 
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> Le problème du carré 
soumis à l'esclave 
de Ménon par Socrate. 


MATHÉMATIQUES 
ET PÉDAGOGIE 


L'éducation mathématique se place aujourd'hui au 
premier rang des fins que se propose l'enseignement. 
Seul l'enseignement de certaines langues vivantes pour- 
rait concourir avec celui des mathématiques, mais comme 
ce dernier est plus délicat à concevoir, plus difficile à 
dispenser, il tient, semble-t-il, la première place dans les 
préoccupations de la pédagogie moderne. On pourrait 
même dire qu'en France, la pensée pédagogique a connu 
un certain renouvellement grâce aux problèmes posés 
par l'enseignement des mathématiques, tandis que, dans 
d'autres pays, la pédagogie possède un statut institution- 
nel régulier et permanent, comme c'est par exemple le 
cas dans les universités allemandes. 

La relance de cette réflexion est profondément enra- 
cinée dans les exigences de la société actuelle; nous 
avons souligné dans le chapitre Mathématiques et société 
que la connaissance de notions élémentaires de mathé- 
matiques est exigée de tous, ou si l’on veut, de tous les 
cadres de la société. L'élite, de plus en plus, est appelée 
à apprécier le point de vue numérique et à être préparée 
de manière à savoir prendre des décisions technique- 
ment, c'est-à-dire quantitativement, fondées. En parti- 
culier, on exige des chercheurs et des ingénieurs des 
connaissances mathématiques plus solides, en raison des 
nouvelles applications de la mathématique à divers sec- 
teurs de l'activité économique. 

Mais quels sont les faits qui sont impliqués dans cette 
réflexion pédagogique ? 

— Il faut remarquer, tout d’abord, que nous vivons 
encore dans la postérité d'une découverte qui constitue 
l'événement de la pédagogie moderne : la découverte de 
l'enfant. La découverte d'un être qui n’impose pas seule- 
ment une réflexion sur le contenu des programmes mathé- 
matiques, mais aussi une élaboration des techniques de 
transmission du savoir; l'enseignement des mathémati- 
ques pose, au niveau élémentaire, des problèmes psycho- 
logiques qu'il faudrait formuler correctement et, si pos- 
sible, résoudre. 
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— Sur ces problèmes généraux, se greffe un pro- 
blème interne aux mathématiques qui ont leur querelle 
des anciens et des modernes. Il ne s’agit pas seulement 
d'enseigner les mathématiques dans le dessein de faci- 
liter l'insertion sociale, mais aussi de savoir quelle mathé- 
matique enseigner, dans quel style, avec quelle concep- 
tion de la rigueur. Et faut-il préparer dès le début l'enfant 
à la matière qu'il devra connaître s'il se spécialise plus 
tard en mathématiques, ou faut-il seulement l'exercer 
à penser mathématiquement, à assimiler moins les notions 
qu'un art de penser? : 

— Enfin, l'évolution de l'École, qui s'impose aujour- 
d'hui à un plus grand nombre d'enfants qu'auparavant, 
a engendré l'exigence que tous soient également pris en 
charge par l'enseignement et que personne ne soit — en 
principe — « laissé pour compte ». 

Il va de soi que ces problèmes ont entre eux certains 
rapports : la formation des professeurs dépend étroite- 
ment de la question de savoir quelles mathématiques 
enseigner; le problème de savoir comment introduire les 
mathématiques a une relation directe avec celui que posent 
les sujets auxquels s'adresse l'enseignement; et surtout, 
on ne trouvera de réponse claire à aucune question si on 
ne résout celle des buts à atteindre par cet enseignement. 


La naissance du concept d‘enfant 


Le problème purement pédagogique que posent les 
mathématiques se situe au niveau de leur enseignement 
aux plus jeunes enfants. La première difficulté est de 
savoir comment articuler, sans une trop grande distorsion, 
un entendement mathématique (c'est-à-dire l'aptitude 
à exercer une activité intellectuelle qui prépare à une 
pratique ultérieure des mathématiques) sur les possibilités 
qui sont propres à l'enfant. 

Poser cette question suppose qu'on s'est heurté à des 
échecs fréquents, et à travers eux, à la réalité spécifique 
de l'enfant, que la pédagogie mathématique, longtemps 
réduite à une simple didactique, c'est-à-dire à une tech- 
nique détachée de toute contexte psychologique, his- 
torique et social, ne peut plus ignorer aujourd'hui. 

Traditionnellement, on oscillait entre deux voies : le 
psittacisme qui fait appel à la mémoire répétitive de 
l'enfant pour fixer les règles de calcul, dont l'origine 
remonte au Moyen Age et à sa prédilection pour la versi- 
fication mnémotechnique, et dont l'apprentissage des 
tables de multiplication a retenu la leçon d'efficacité ; et la 
maïeutique, immortalisée par le dialogue entre Socrate 
et Ménon. Celle-ci est à l'origine d'une conception, non 
disparue aujourd'hui, d'une mathématique éternelle et 
indépendante. La maïeutique tient tout entière dans le 
mot fameux : « C'est toi qui le diras »; mais on remarquera 
qu'il s'agit, en fait, d'une méthode fondée sur le déploie- 
ment d'un doute, c'est-à-dire sur le rejet systématique des 
« préjugés » liés à la langue naturelle : Ménon, qui a 
pourtant mille fois parlé de la vertu, se trouve, après un 
premier entretien avec Socrate, totalement désorienté 
et ne sait plus que penser. C'est le moment que choisit 


Richard Colin 


Socrate pour affirmer qu'apprendre, c'est se ressouvenir, 
et le montrer pour ainsi dire expérimentalement, en faisant 
appel à un des esclaves de la nombreuse suite de Ménon. 
Celui-ci, de qui on n'exige qu'une chose, entendre le 
grec, se montre capable de trouver comment obtenir un 
carré dont la surface est double de celle d'un carré donné 
de deux pieds. Socrate n'apporte pas du dehors la science 
à son nouveau disciple, mais l’aide à se représenter visuel- 
lement la figure à construire qui sera sans doute un carré 
de côté plus grand que celui du carré donné mais plus 
petit que celui du carré de quatre pieds de côté, auquel 
a d'abord songé l'esclave. Peut-être, pense alors l'esclave, 
la solution consiste-t-elle à prendre un côté de trois 
pieds, mais il est vite détrompé. Devant la difficulté, force 
est de revenir à la première hypothèse et de regarder 
comment se présente le carré de quatre pieds de côté; 
sa surface vaut quatre fois celle du carré donné au départ : 
le dessin montre les quatre carrés égaux au premier 
carré: mais si on divise chacun de ces quatre carrés en 
deux triangles égaux, en traçant les diagonales conve- 
nables, on voit que les diagonales forment à leur tour 
un ‘carré qui répond à la question. L'esprit de l'esclave a 
cheminé progressivement vers cette vérité sans que Socrate 
ait auparavant exigé de lui autre chose qu'une commu- 
nauté de langue permettant le dialogue. 

Si nous avons rappelé cette méthode, c'est qu'elle 
contient tous les problèmes posés par l'enseignement des 
mathématiques. Que l'usage du dessin, de la figure, ou, 
si l’on veut, de l'intuition, n'explicite pas ses règles est 
un problème de didactique que nous examinerons plus 
loin ; mais la façon dont intervient la notion de diagonale 
pose le problème de l'introduction d'une notion acces- 
soire : la façon dont on le résout implique une définition 
de la science, laquelle apparaît effectivement plus loin 
dans le Ménon, dans le sort qui est fait à l'idée d'hypo- 
thèse : quand on demande au géomètre à propos d'une 
surface, par exemple, si tel triangle peut s'inscrire dans 
tel cercle, il répondra : « Je ne sais pas encore si cette 
surface s'y prête; mais je crois à propos, pour le déter- 
miner, de raisonner par hypothèse de la manière suivante : 
si cette surface est telle que le parallélogramme de même 
surface appliqué à une droite donnée est défaillant de 
telle surface, le résultat sera ceci; sinon il sera cela. » 

La mise en forme de la conception sous-jacente à cette 
pédagogie a donné les Éléments d'Euclide, chef-d'œuvre 
de logique sans pédagogie, fondé sur l'idée que pour les 
mathématiques il n’y a point de voie royale, ni de voie 
enfantine. 

Rousseau fut sans doute le premier à en dénoncer expli- 
citement et systématiquement le caractère abstrait. Non 
seulement il déclare, dans les Confessions, ne point 
goûter personnellement la méthode d'Euclide qui cherche 
plutôt la chaîne des démonstrations que la liaison des 
idées, non plus que celle de l'algèbre « abstraite », mais 
encore, dans l'Émile, il dénonce la tentation de suggérer 
ou de dicter des démonstrations sous le couvert d'un 
apprentissage de la découverte. Nul n'a trouvé avant lui 
de formule aussi nette pour souligner la nécessité d'éla- 
borer une pédagogie réelle : « Nous ne sentons pas, 
écrit-il, que leur méthode [celle des enfants] n'est pas la 
nôtre, et que ce qui devient pour nous l'art de raisonner 
ne doit être pour eux que l'art de voir. Au lieu de leur don- 
ner notre méthode, nous ferions mieux de prendre la 
leur. » Il ne s’agit de rien moins que de l'effacement de 
l'éducateur devant l'enfant et de la mise en question du 
fait que l'éducation est généralement moins une forma- 
tion du jugement que la stratégie de reproduction d'une 
mentalité adulte donnée. 

Un véritable concept de l'enfant est créé; l'éducation 
y sera subordonnée dans la mesure où l'enfant n'a pas à 
apprendre quelque chose mais à apprendre à apprendre. 
D'où la critique acerbe de « la manie enseignante et 
pédantesque », confinée dans la transmission des sciences 
qui sont le moins utiles à l'enfant, alors que par une véri- 
table providence les facultés ne se développent qu'avec 
les occasions d'être exercées, en sorte qu'elles ne sont 
jamais « ni superflues ni à charge dans le temps, ni tardives 
et inutiles au besoin ». Les facultés humaines sont donc, 
selon Rousseau, d'abord des facultés virtuelles, et le 
développement de la raison est à son tour lié à celui de la 
sociabilité. D'où la nécessité de respecter « l'enfance » 
qui n’est encore capable ni de jugement, ni de raison, ni de 
mémoire ; et donc point d'initiation directe aux mathé- 


matiques. « En m'objectant qu'ils apprennent quelques 
éléments de géométrie, on croit bien prouver contre moi: 
et tout au contraire, c'est pour moi qu'on prouve : on 
montre que, loin de savoir raisonner d'eux-mêmes, ils ne 
savent pas même retenir les raisonnements d'autrui; car 
suivez ces petits géomètres dans leur méthode, vous voyez 
aussitôt qu'ils n'ont retenu que l'exacte impression de la 
figure et des termes de la démonstration. À la moindre 
objection nouvelle, ils n'y sont plus. Renversez la figure, 
ils n'y sont plus! Tout leur savoir est dans la sensation, 
rien n’a passé jusqu'à l'entendement » (Emile, livre 11). 

Par là, Rousseau est certainement le premier pédagogue: 
il crée une préoccupation visant l'enfant en tant que tel, 
non sans rester lui-même prisonnier de l'idéologie de son 
siècle, celle de Condillac surtout, qui le conduit à compa- 
rer l'enfant à une « table rase », apte à recevoir des connais- 
sances « contingentées », illustrées et adaptées aux besoins 
de chaque étape d'un développement dont toute l'his- 
toire baignaït encore dans le mystère. Mais, désormais, 
la nécessité est posée qu'éduquer l'enfant implique d'abord 
de le connaître. A vrai dire, ce principe ne fut mis en œuvre 
que dans les dernières décennies du XIX® siècle, où les 
nouvelles exigences politiques et démographiques ont 
conduit à ce qu'E. Claparède (1873-1940) considérait 
comme une révolution copernicienne : le fait de centrer 
l'école sur l'élève au lieu de mettre l'élève au service de 
l'école. En réalité, il s’agit de la première « institution- 
nalisation des droits de l'enfant » également proclamés 
par la Révolution (lois des 16 et 24 août 1790 et décrets 
de 1792 et 1793). 

L'intérêt pour l'enfance dépasse alors de loin le plan 
conceptueletidéologique auquel étaientrestés Rousseau et 
les déclarations révolutionnaires; il se concrétise dans 
l'étude «scientifique » de l'enfant. W. T. Preyer ouvre la voie 
par une étude consacrée à l'esprit de l'enfant (1881), 
bientôt suivie (1891) aux États-Unis par l'initiative déci- 
sive de G.S. Hall qui fonde un périodique spécialisé, 
puis le « National Association for the Study of Children ». 
Des institutions analogues se créent un peu partout en 
Europe, et en Russie. En France, F. Buisson et A. Binet 
animent la « Société libre pour l'étude psychologique de 
l'enfant » ; à Genève, l’ «Institut Jean-Jacques Rousseau » 
reprend, dès 1912, le travail commencé dans le séminaire 
de Claparède créé en 1906. 

Mais le renouvellement de la conception de l'enfance 
ne sera total qu'avec les révélations de la psychanalyse, 
qui voit en l'éducation la répression organisée des ins- 
tincts, répression rarement réussie, et toujours « au profit 
d'un petit nombre d'hommes privilégiés dont il n’a pas été 
requis qu'ils réprimassent leurs instincts ». L'éducateur 
ne peut plus ignorer les difficultés d'une voie à chercher 
entre « le Scylla du laisser-faire et le Charybde de l'inter- 
diction ». 

Ainsi, on ne peut éduquer un enfant en dépit de son 
« affectivité »; d'autre part, toute « nourriture intellec- 
tuelle » n’est pas bonne indifféremment à tous les âges; 
il faut tenir compte des intérêts et des besoins de chaque 
période. 

L'enseignement doit donc s'adapter; et l'enseignement 
des mathématiques ne peut faire exception. Mais l'adap- 
tation est d'autant plus juste que l'on a su détecter les 
aptitudes ou les incapacités. C'est À. Binet qui consacre 
l'approche métrologique de l'écolier par l'évaluation de 
son intelligence et l'élaboration d'échelles, de calcul 
et de lecture notamment. Cela conduit à l'échelle métrique 
de l'intelligence, de l'inintelligence diront d'autres! qui 
a été reprise par R. Zazzo en 1949 et en 1966, et qui s'est 
imposée par l'intermédiaire des notions aujourd'hui consa- 
crées d'âge mental et de quotient intellectuel. 

Pour ce qui concerne les mathématiques, ce qui est au 
centre de la réflexion pédagogique, c'est le problème que 
constitue l’incompréhension des enfants; les mathéma- 
tiques seraient pour certains élèves des activités « chargées 
d'angoisse » (voir Stella Baruk, Échec et Maths, Seuil, 
1973), ce qui se comprend aisément quand on voit « dans 
quelles aventures les entraînent l'échec scolaire d'une 
manière générale, et l'échec en maths en particulier. 
De bilan en test et de test en dossier, de dossier scolaire 
en dossier psycho-scolaire, de dossier psycho-scolaire en 
consultation de psychologue, et de consultation en réédu- 
cation, le chemin est jalonné d'épreuves, de contre- 
épreuves, de diagnostics et de contre-diagnostics conver- 
gents ou contradictoires, qui ont cependant en commun 
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le superbe non-sens : expliquer l'échec par sa justification ». 
C'est dire la déconvenue de tous les recours de la péda- 
gogie à la psychologie, qui vont généralement dans le 
sens de cette justification, et qui marquent, sur le plan 
historique, certains moments forts : les crises manifestées 
par l'échec de l'institution scolaire dans ses projets de 
transformation du système éducatif. D'abord, la faillite 
de « l'illusion pédagogique » de la démocratie scolaire a 
conduit à la création de l'arsenal conceptuel qui préside 
à l'usage idéologique de la notion de « débilité »; la 
découverte, après l'augmentation du nombre des élèves 
exigée par l'avancement de la société industrielle, du 
rapport entre réussite scolaire et origine sociale a motivé les 
études sur la sociologie de l'éducation, d'abord aux 
États-Unis (Skelles et Fillmore dès avant la Seconde 
Guerre mondiale), puis en France (R. Zazzo et Dabout ont 
fait en 1954 une publication sur la progression scolaire et 
l'inégalité des enfants devant l'école). Ensuite, l’idée que 
toute pédagogie dépend, en dernier ressort, d’un choix 
idéologique et politique, qu’elle vise chaque fois, et non 
seulement dans des cas limites, à réduire le désir de l‘en- 
fant au besoin, en lui substituant des automatismes qu'elle 
considère comme autant de garde-fous, autrement dit, 
la rencontre dans leurs ultimes exigences des critiques 
d'origine marxiste et psychanalytique, a conduit souvent 
à un syncrétisme décevant, mais parfois aussi à une meil- 
leure analyse des raisons de l'échec des conseillers d'orien- 
tation scolaire et professionnelle, institués après la der- 
nière guerre, et de tout le système d'éducation qui pro- 
duit l'échec scolaire. Au total, l'école apparaît comme un 
appareil idéologique au service de l'État, qui ne fait que 
reproduire les rapports sociaux existants. Comme on l’a 
dit, c'est dans les fonctions sociales qu'on trouvera les 
raisons de la structure de l’école. 

L'échec mathématique ne peut échapper à la force 
d'analyses de ce type; elles nous disent que l'échec de 
l'enfant est un mythe, surtout lorsqu'il s'agit de mathéma- 
tiques, où l'on s'ingénie à faire croire que l'enfant peut 
en faire la découverte personnellement et par lui-même, 
quand le moindre concept a coûté des années de travail à 
un ou plusieurs auteurs ! Comment servir à un enfant le 
concentré de recherches millénaires? Cette question, en 


tant qu'elle manifeste le souci de l'enfant, pose des pro- 
blèmes de didactique mathématique que nous allons 
examiner maintenant. 


La didactique mathématique 


La maïeutique platonicienne 

On a enseigné les mathématiques bien avant l'institu- 
tion de l'école (au sens moderne), et réfléchi sur les diffi- 
cultés de cet enseignement bien avant que n'apparaisse 
le souci de savoir s'il était ou non structurellement 
conforme à la mentalité de « nos enfants ». Aussi n'est-il 
peut-être pas étonnant qu'une approche pédagogique et 
didactique retrouve un problème qui, chez Platon, est 
rapporté aux fondements des mathématiques : au lieu 
d'escamoter le rapport entre un fait de langage tel que 
« 2 et 2 font 4 » et un fait mathématique tel que 
«2—+— 2— 4 y», Platon s'acharne, pour ainsi dire, à éla- 
borer cette difficulté. Socrate dit dans le Phédon être 
fort loin d'avoir compris l'addition et de pouvoir dire, 
lorsqu'à une unité on ajoute une unité, « si c'est l'unité à 
laquelle cette dernière a été ajoutée qui est devenue 2, 
ou si c'est l'unité ajoutée et celle qui a recu cette adjonc- 
tion qui, du fait même de cette adjonction de l'une à 
l'autre, sont devenues 21! » C'est, en effet, pour Socrate, 
un sujet d'étonnement « que, lorsqu'elles étaient, chacune, 
à part l'une de l'autre, chacune des deux visiblement 
unité et qu'alors il n'y eût pas de 2 ; et que, une fois qu’elles 
se sont rapprochées, il n'a fallu, paraît-il, pour faire qu'elles 
devinssent deux, d'autre cause que leur réunion par voie 
de mutuelle juxtaposition ». Voilà un étonnement qui ne 
serait plus de mise aujourd'hui dans un enseignement 
élaboré, mais tout à fait à sa place dans une véritable 
initiation, qui néglige forcément le détour de la méthode 
axiomatique abstraite. 

C'est pourquoi la didactique des mathématiques est 
également, de manière à la fois spontanée et nécessaire, 
une réflexion sur la rigueur indispensable dans cet ensei- 
gnement. — Du reste, répondant aux besoins de la société, 
l'enseignement des mathématiques s’est, à partir de la 
Révolution (et avec la création des « Écoles centrales », 
notamment), généralisé jusqu'à constituer aujourd'hui 
le centre de gravité de tout enseignement. Si, depuis le 
Moyen Age, on a successivement accordé de l'importance 
à la grammaire dans la mesure où elle semblait constituer 
le vestibule de la logique, puis à la langue en général et 
aux humanités parce qu'elles formaient le bon sens, il 
devient progressivement de plus en plus évident que la 
prépondérance doit être accordée aux mathématiques 
pour les mêmes raisons, les mathématiques n'étant dans 
leur partie abstraite, comme l'avait très bien exprimé 
A. Comte (Cours de philosophie positive, Hermann, 1976, 
p. 64), qu'une « immense extension admirable de la 
Logique naturelle à un certain ordre de déductions ». 


L'importance du manuel au siècle des lumières 

A vrai dire, le désir d'exposer rigoureusement les mathé- 
matiques fut d'abord, partiellement, un besoin didactique. 
C'est l'enthousiasme pédagogique du siècle des lumières 
qui engendre ces traités de mathématiques élémentaires, 
suscités par la création de nouvelles universités et de 
nouvelles chaires de mathématiques. Ce sont les auteurs de 
ces manuels, tant ridiculisés par un grand génie comme 
Gauss sous le nom de « Compendien-Schreiber », qui 
expriment d'abord cette volonté de rigueur. Parmi ces 
faiseurs de manuels, le plus fameux, A. G. Kästner, illustre 
admirablement la fonction de l'enseignement et de son 
organe essentiel, le manuel, très commode pour propager 
un savoir qui serait autrement resté l'exclusivité des spé- 
cialistes ! L'exemple de Kästner nous explique le mystère 
de la longue alliance de la littérature et des mathémati- 
ques, de la géométrie et du talent d'écrivain; ainsi qu'iro- 
nisait Gauss, Kästner était « mathématicien parmi les 
poètes et poète parmi les mathématiciens ». Et c'est sans 
doute là l'origine de ces « exposés décoratifs » (Gode- 
ment) qui permettaient, il n'y a pas si longtemps, à cer- 
tains d'être candidats à l'Académie des sciences et à 
l'Académie française |! Mais c'est aussi et surtout l'origine 
de la nécessité, alors très relative, d'écrire pour les débu- 
tants des exposés aussi explicites que possible, où l'on 
essaie de tout démontrer et de tout définir. Par ses manuels, 
Kästner a permis à tous ceux qui ne pouvaient écouter un 
maître d'apprendre cependant les mathématiques. Le 
savoir mathématique s'est mis à circuler à une échelle 
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plus populaire, conformément à la demande du rationa- 
lisme des lumières, expansif, prosélyte et intellectuellement 
réformateur. La création de nouvelles universités aux 
XVIIe et XVIIIe siècles s'accompagne ainsi d'une diffusion 
nouvelle des instruments du savoir. L'esprit géométrique 
alors à la mode descend des cimes vers le public cultivé, 
grâce au cours de Joseph Sauveur (1653-1716) où, 
à Paris, les gens se pressent, et grâce aux universitaires, 
tel Kästner, à Gôttingen, qu'écoutent aussi ceux qui voient 
dans la science le seul moyen d'ascension sociale à 
leur portée. 

Dans une lettre à Maupertuis, Kästner reconnaît lucide- 
ment que, s’il est incapable « d'éclairer le monde comme 
les grands génies. il sait au moins profiter de leurs lumiè- 
res et les communiquer à d'autres qui, sans cela, n'en 
auraient peut-être tiré aucun autre avantage ». Bref, 
on n'en est plus à commenter Euclide; on réfléchit sur la 
façon d'exposer avec rigueur les mathématiques. 

Bernard Bolzano (1781-1848) développe une théorie 
de l'exposition, réflexion critique et méthodique inspirée 
par l'apparition et la popularisation des manuels depuis 
Kästner. B. Bolzano a justement appris les mathématiques 
dans les livres de Kästner, qui n'a pas inventé grand- 
chose, mais s'est évertué à prouver des évidences et à 
justifier toutes ses démarches, «à démontrer ce que d'autres 
passent allègrement sous silence, c'est-à-dire. à éclairer le 
lecteur sur la raison qui sous-tend un de ses jugements », 
note Bolzano, qui avoue par ailleurs en avoir été assez 
impressionné pour se mettre aux mathématiques (B. Bol- 
zano, Lebensbeschreibung, Sulzbach, 1836, p. 19). Mais 
dans son propre effort de rendre les mathématiques 
accessibles et absolument claires à tout débutant, Bolzano 
découvre qu'il faut faire la théorie de leur langage et 
expliciter la logique qu'elles véhiculent dans leurs raison- 
nements. C'est ainsi qu'il est amené à réfléchir sur la notion 
de « proposition », de « démonstration », sur la nécessité 
de soumettre l'usage des symboles à des règles à la fois 
précises et explicites, à vouloir que l'effort d'explicitation 
aille jusqu'à réaliser la maxime leibnizienne « qu'il est 
bon de chercher les démonstrations des axiomes eux- 
mêmes », contrairement à |’ « intuitionnisme » naïf 
ambiant dont un Ladomus s'était fait le défenseur dans 
ses Contributions à la méthodique de la mathématique 
pure, reléguant dans une discipline extérieure aux mathé- 
matiques l'exigence de fonder clairement ce qu'on avance. 
En considérant, au contraire, que cette exigence doit être 
interne aux mathématiques, Bolzano est conduit à refuser 
la philosophie mathématique de son époque, celle de 
Kant, et à critiquer la notion de jugement mathématique, 
dont il souligne le caractère analytique, c'est-à-dire le 
fait qu'il n’est subordonné à aucune autre discipline 
sinon justement la logique mathématique. 


Le lien au XIX° siècle entre le souci de l'exposition 
et les exigences de rigueur logique 

La réflexion sur la méthodique mathématique est donc 
liée à l'exigence de didactique persuasive et de rigueur 
dans l'exposition (en France, c'est Develey qui s'était 
fait l'écho, dans ses Essais de méthodologie [Paris, 1831], 
de ces préoccupations); elle sera bientôt suivie d'une 
réflexion sur les fondements logiques des notions élé- 
mentaires des mathématiques, et le point remarquable 
pour notre propos, c'est que cette réflexion ne cesse d'être 
liée à un souci pédagogique. 

En effet, lorsque Richard Dedekind réfléchit aux fonde- 
ments de la théorie des nombres, ce n'est pas seulement 
parce que celle-ci s'était révélée comme la partie essen- 
tielle des mathématiques, mais aussi en vue de rendre 
possible un enseignement rigoureux. Cela impliquait de 
renverser la priorité cartésienne de l'évidence sur la 
certitude et de satisfaire la nécessité de « convaincre » 
avant celle d’ « éclairer » : d'abolir, donc, le recours à 
l'intuition géométrique dans la démonstration de théo- 
rèmes d'analyse. Tout cela, Dedekind en a fait l'expé- 
rience dans son enseignement, quand il était professeur 
à Zürich : il lui fallait, alors, expliciter les bases d'un savoir 
qui, pour être compris de tous, ne devait appartenir à 
personne, devait donc être dépouillé de tout arbitraire; 
en abordant sans préjugés les problèmes qui se posent à la 
base, Dedekind élargit l'élucidation acquise aux sommets. 

Mais l’arithmétique, science élémentaire, était aussi du 
ressort de l’enseignement secondaire. Les manuels de ce 
niveau attirent l'attention de G. Frege, l'initiateur de la logi- 
que mathématique moderne, qui, avant sa fameuse /déo- 
graphie (1879), ne dédaigne pas la tâche de les examiner. 
Il critique sévèrement le manuel de H. Seeger, Die Ele- 
mente der Arithmetik, où l'écolier n'est supposé mettre 
en œuvre que sa mémoire pour retenir les lois de l'arith- 
métique. Frege avait, du reste, été appelé à remplacer 
Karl Snell, dont il a retenu, comme il l'écrira plus tard, 
« le principe qu'en mathématiques tout devrait être 
aussi clair que 2 + 2 = 4», à condition que«2 + 2 = 4» 
soit clair! Méditant cet avertissement, Frege s'aperçoit 
que la « rigueur logique » n'est pas naturelle, qu'elle est 
le couronnement d'un travail mathématique qui se révèle 
peu susceptible, en tant que tel, d'être assimilé par des 
têtes mathématiquement vierges. 

Bien sûr, les problèmes posés par l'enseignement des 
mathématiques n'ont pas, seuls, déterminé l'évolution 
de la réflexion sur les fondements des mathématiques. 
Mais ils sont ancrés dans le devenir des mathématiques 
du XIXe siècle, souvent de manière indirecte, dans les 
réformes consécutives à de nouvelles perspectives socio- 
économiques, et parfois de manière directe, puisque 
l'exposition doit être de nature à éviter tout obstacle à la 
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compréhension d'une discipline en principe intelligible 
sans recours extérieur ni antérieur. Ce n’est donc pas un 
hasard si l'on distingue aujourd'hui entre l'analyste ou 
l'algébriste, qui peut tout ignorer de la logique mathé- 
matique, et l'enseignant qui a besoin au contraire d’une for- 
mation logique assez poussée (voir Daniel Lacombe, 
Didactique des disciplines, bulletin n° 2, janvier 1974, 
p. 4). 

Pour l'enseignant soucieux de logique, la première 
nécessité est de prendre au sérieux le caractère logique 
des mathématiques; on ne saurait trop recommander 
aujourd'hui, où on initie de petits enfants à la théorie des 
ensembles, de se méfier des intuitions, des illustrations 
hasardeuses, des idées courantes sur de prétendus rap- 
ports entre les opérations concrètes effectuées par les 
petits de l'homme et les raisonnements mathématiques, 
qui en exprimeraient d'une certaine façon l'intériorisation. 
Outre les difficultés propres à cette métaphore de l'assi- 
milation, de la digestion et de l’ingestion, on ne voit pas 
comment interpréter en termes de manipulation des pro- 
positions de logique, ni comment un travail, souvent consi- 
dérable, d'élaboration logique peut se réduire à l’expli- 
citation d'actes intériorisés ! On ne saurait trop recomman- 
der aussi d'éviter le recours aux « devinettes ». Bolzano 
déjà faisait une remarque qu'on aurait mille occasions de 
répéter aujourd'hui; il observait que si on ne lui indique 
pas d'avance l'énoncé qu'on veut lui faire démontrer, 
l'apprenti mathématicien ne voit pas le but pour lequel 
telle construction ou tel chemin démonstratif s'impose. 
Par exemple, dans la démonstration traditionnelle du 
théorème de Pythagore, qui peut donner au débutant 
des raisons acceptables pour justifier le tracé de telles 
lignes, celles-ci plutôt que d'autres, si on ne lui a pas 
préalablement indiqué qu'il est utile de considérer le 
rapport entre les aires des carrés formés sur les côtés du 
triangle ? Sans doute, au lieu de désigner brutalement la 
voie à suivre, on pourra traiter des problèmes analogues 
et plus simples qui serviront de repères à l'élève. 

Voici l'exemple simple d'un exercice mal posé, où l'on 
demandait aux enfants de colorier, parmi les jouets, ceux 
qui roulent, et qui déchaîna un drame à cause de l'avion 
dont on ne voit, sur le dessin, que les ailes et le fuselage, 
ce qui n'empêcha pas certains enfants de penser qu'il 
avait besoin de roues pour décoller! 

La question est, en fait, posée de manière à renforcer 
les interférences, que les enfants n'ont de toute façon 
que trop tendance à laisser s'installer, entre les objets 
dessinés et ceux qu'ils utilisent réellement dans leurs 
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jeux, ce qui ne leur facilite pas la tâche de saisir le 
caractère abstrait du schéma et la nécessité de l'observer 
pour lui-même. La représentation des jouets n’a de sens 
que par rapport à l'intention dans laquelle elle a été 


faite : qu'on colorie seulement les dessins d'objets où 
figurent des roues; « si c'est ça qu'il [le maître] veut, il 
n'a qu'à le dire », remarquent les enfants auxquels on 
explique après coup cette intention ! 

Le dire? Ce n'est pas toujours facile, comme le savait 
bien Socrate, qui, après avoir vainement tenté de mettre 
l'esclave de Ménon sur la voie de la solution de la dupli- 
cation du carré, lui dit enfin : « Essaie de nous répondre 
avec exactitude. Et si tu ne peux pas nous dire le nombre, 
montre-le nous »; où un lecteur averti comprend que le 
côté du carré cherché ne peut être exprimé par un nombre: 
il est « inexprimable », irrationnel, indication qui devrait 
suffire à faire penser à la diagonale du carré donné au 
départ. Il faut pour ainsi dire s'être déjà heurté à l’incom- 
préhension des élèves pour chercher une formulation 
plus précise pour l'énoncé du problème posé voir les 
remarques de Pierre Samuel sur « l'apparente objectivité 
de la sélection » par les examens dans Pourquoi la mathé- 
matique ? 10/18, pp. 158-170. 

Mais si certains éléments implicites ne demandent 
qu'à être dits pour que tout s'éclaire, il en est que seule 
une connaissance de la /ogique mathématique permet 
d'éviter. Celle-ci est née justement, avant la découverte 
des fameux paradoxes de la théorie des ensembles, de la 
nécessité d'expliciter les principes du raisonnement 
mathématique et de formuler précisément certains faits 
d'analyse que l'ignorance de l'usage des quantificateurs 
laissait dans une grande confusion. On sait, par exemple, 
l'importance de la place des quantificateurs successifs 
qui interviennent dans les définitions de la continuité et 
de la convergence, et qui offrent un moyen à la fois simple 
et sûr de distinguer la continuité ou la convergence uni- 
forme de la continuité ou de la convergence simple. D'où 
la nécessité d'introduire aussi tôt qu’on le peut des notions 
de logique et d'éviter de sous-entendre les quantificateurs 
à une époque où nul n’enseigne plus le « carré logique » 
aristotélicien, grâce auquel on pouvait éviter les confusions 
entre le contraire d'un énoncé et sa négation. 

Cependant, la mise au point d'une didactique « hon- 
nête » maintient toujours l'enseignement mathématique 
dans l'ornière de la méthode, de l'intelligence de l'acquis, 
donc de l'apprentissage et du « dressage ». II n'échappe pas 
au risque de réduire l'enseignement au montage correct 
d'automatismes efficaces. Cela pose deux problèmes : 


d'une part, que convient-il d'exiger de l'apprenti mathé- 
maticien ? Un apprentissage effectif, qui fait donc plus 
ou moins appel à sa mémoire, ou une capacité d'imaginer 
des médiations, c'est-à-dire une intelligence générale 
indépendante de l'apprentissage ? D'autre part, on peut se 
demander si un véritable enseignement des mathématiques 
ne serait pas plutôt une initiation à la découverte, décou- 
verte mathématique et non découverte des mathématiques. 
Or la solution de ce dernier problème dépend de la concep- 
tion qu'on a des mathématiques; discipline spéculative, 
où il vaudrait donc mieux apprendre à créer, un peu 
comme en philosophie on apprend — en principe — 
à philosopher plutôt que le contenu des doctrines philo- 
sophiques; ou discipline utile, soit que l'on croie y résou- 
dre les questions significatives par leurs applications, soit 
qu'on prétende s'inscrire dans une tradition de problèmes 
prestigieux. Quelles que soient les réponses à ces ques- 
tions, on voit ce qu'elles mettent en jeu : comment, c'est-à- 
dire quelles mathématiques enseigner ? 


Le contenu de l’enseignement - 
Des programmes scolaires 


La question du contenu de l'enseignement des mathé- 
matiques se pose dans la mesure où les nouveaux déve- 
loppements des mathématiques ont exigé un changement 
de structure de l'enseignement primaire et secondaire, 
qui en harmonise les programmes avec ceux de l'enseigne- 
ment supérieur. 

Certains auront entendu la fameuse déclaration de ce 
professeur d'université qui commençait l'année par ces 
mots : «Il y a une seule façon de comprendre le cours que 
je vais vous faire, c'est d'essayer d'oublier tout ce que vous 
avez appris au lycée »! Derrière l’incohérence ou la dis- 
continuité que dénonce cette boutade, se cache un 
problème philosophique : celui que Frege désignait comme 
celui des « définitions par morceaux », dont il dénoncçait 
l'usage courant, surtout depuis les extensions successives 
des nombres. Concepts et opérations sont ainsi définis 
pour un domaine restreint, celui des nombres entiers 
positifs, par exemple; puis, avec l'introduction d'éléments 
nouveaux, les nombres négatifs, fractionnaires, irration- 
nels, etc., on redéfinit exprès ce qu'on avait déjà défini, 
mais de façon à englober les opérations et les concepts 
propres à régir les éléments nouveaux. Ainsi les symboles 
n'ont pas de signification « définitive », et les concepts 
paraissent incohérents, puisqu'on demande à l'élève 
d’ « oublier » dans le secondaire qu'il était interdit d'écrire 


&« 3— 5 », et à l'Université qu'il le fut de poser \— 5. 
Logiquement, cela signifie que la valeur de vérité d'un 
énoncé d'un langage dépend des structures qui constituent 
les réalisations de ce langage (voir la définition desconcepts 
de «réalisation » et de « modèle » d'un langage formel dans 
le chapitre Logique). 

Rigoureusement, il faudrait donc disposer du concept 
d'un anneau quelconque K, et expliciter la quantifica- 
tion sous-jacente, afin qu'on voie que « y est un carré 
dans K » signifie « il existe x dans K et le carré de x est 
égal à y ». Autrement dit, un enseignement homogène 
d'une mathématique sans ruptures se fonde sur la méthode 
axiomatique, qu'on suppose aussi familière que les prin- 
cipes élémentaires de la déduction aux étudiants entrant 
à l'Université. C'est pour que cette supposition corres- 
ponde à une réalité qu'ont été introduites les mathémati- 
ques « modernes » dans l'enseignement primaire et 
secondaire. Cette innovation correspond à l'exigence de 
limiter la prédominance de la géométrie et, par là, du 
recours facile à | « intuition » ou visualisation concrète 
et singulière d'objets susceptibles d'une définition plus 
abstraite et plus générale. La pensée abstraite doit, 
certes, au niveau de l'enseignement secondaire, laisser sa 
place à une certaine visualisation, par exemple dans 
l'étude et la représentation graphique des fonctions par 
leurs courbes; mais il importe que celle-ci se déploie 
dans les limites clairement déterminées par un cadre 
logique et axiomatique. 

C'est ainsi que M. Dieudonné avait, il y a plus de 
quinze ans (en 1959, à l'occasion d'une session d’études 
consacrée à la réforme de l'enseignement des mathé- 
matiques par la Direction des affaires scientifiques), 
conçu un programme moderne d'enseignement des mathé- 
matiques, dont voici les grandes lignes : 

— Avant 14 ans, on se bornerait à un travail pour ainsi 
dire expérimental sur l'algèbre et la géométrie plane, 


en ne soulignant les déductions logiques qu'aux endroits 
où c'est possible. La part du lion est faite à l'algèbre, 
dans la mesure où la géométrie elle-même s'organise 
autour des notions fondamentales de symétrie, transla- 
tions, produit de transformations, etc. On n'omettrait pas 
d'introduire le langage adéquat, c'est-à-dire le langage 
commun à toutes les branches des mathématiques 
actuelles, et si possible, de développer les règles ordi- 
naires de l'arithmétique à partir des axiomes de Peano, 
dont l'enseignant aura montré la nécessité aux élèves 
en les faisant réfléchir sur notre acceptation de la validité 
des lois de l'arithmétique pour des nombres inaccessibles 
à notre intuition. 

— À 14 ans, on introduirait la notion de courbe 
représentative d'une fonction et différentes méthodes 
d'approximation. On peut aussi présenter, non pas une 
définition, mais une étude axiomatique des nombres 
réels, et donner, comme résultats, ultérieurement démon- 
trables, l'existence du maximum, et le théorème de Bolzano 
sur l'existence des racines. 

— À 15 ans, il est possible de formuler les axiomes 
exprimant que, pour l'addition, un espace vectoriel est 
un groupe commutatif, en prenant soin de développer les 
conséquences logiques tant du point de vue algébrique 
que du point de vue géométrique, c'est-à-dire en donnant 
les conséquences avec les deux interprétations possibles, 
ce qui fournit l'occasion d'entrevoir le concept de modèle. 

— À 16 ans, le décollage axiomatique ayant déjà eu 
lieu, on approfondirait l'étude des groupes de la géo- 
métrie plane, en définissant la notion de mesure des angles 
comme homomorphisme du groupe des nombres réels 
sur le groupe des rotations, et en introduisant les nombres 
complexes avec leur interprétation géométrique. L'aspect 
technique consisterait dans l'étude de la notion de fonc- 
tion primitive et de la notion d'aire pour des domaines 
simples, avec des exemples élémentaires. 

— À 17 ans, la géométrie à trois dimensions doit 
être présentée axiomatiquement, avec emploi des matrices 
et des déterminants d'ordre 3. Du point de vue technique, 
on montrerait l'utilisation des fonctions primitives pour 
calculer les volumes simples, et l'on introduirait les coor- 
données polaires et la méthode de construction d'une 
courbe donnée par une équation en coordonnées polaires. 
On peut, encore, étudier les fonctions logarithme et expo- 
nentielle, sans démonstration d'existence mais en insistant 
sur le fait qu'il s'agit d'homomorphisme de groupes. 

Voilà pour le secondaire. Mais comment y préparer 
les enfants plus jeunes ? Les problèmes les plus délicats 
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<« Faire comprendre 

les concepts d'ensemble 

et de nombre en s'appuyant 
sur des schémas, 

mais sans mutiler 
totalement ces notions 

de leur caractère 

d'entités abstraites. 
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À Selon la méthode 
préconisée par 

Georges Papy, 

une application des graphes 
au jeu des relations 
familiales. 

Si d'un point 

part une flèche bleue 

vers un second point 

et que de celui-ci soit 

issue une flèche jaune 

vers un troisième point, 

ce dernier est 

le grand-père maternel 

du premier; 

de l'un à l'autre, 

traçcons directement 

une flèche rouge 

qui représente le produit 
de la relation M 

(comme mère) 

par la relation P 

{comme père). 

De même, une flèche jaune 
suivie d'une flèche bleue 
désigne la grand-mère 
paternelle, c'est-à-dire 

le produit P par M que 
nous désignons directement 
par une flèche verte. 
Comme le grand-père 
maternel est différent 

de la grand-mère paternelle, 
les enfants écrivent 

au tableau l'équation 

(P- M) £ (M-P) 

[noter la couleur différente 
des parenthèses]. 


se posent là, car on ne peut être rigoureux qu'au risque 
d'être inaccessible, quand on s'adresse à de petits enfants. 
Il s'agit alors moins de respecter les réquisitoires de la 
rigueur déductive que d'expliciter le mieux qu'on peut, 
sans fermer les portes à l'imagination et à l'initiative, et 
sans perdre de vue le but qui est d'arriver à ce que les 
mathématiques soient saisies comme une activité créa- 
trice. Des essais intéressants ont été tentés dans cette 
perspective, parmi lesquels il faut citer d’abord la Mathé- 
matique moderne de Papy, dont l'ambition est de faire 
participer le débutant à la construction active de l'édifice 
mathématique à partir de situations simples, et de l’initier 
— dès l'âge de douze ans — aux éléments de la théorie des 
ensembles. 

Moins connu en France, sans doute, est le bel effort 
de Patrick Suppes, grand mathématicien américain qui 
a consacré à la théorie abstraite des ensembles un traité 
fameux, mais qui a aussi concu un programme destiné 
aux enfants des maternelles auxquels il s'agit essentielle- 
ment de faire comprendre les concepts d'ensemble et de 
nombre, en s'appuyant, certes, sur des schémas, mais 
sans mutiler totalement ces notions de leur caractère 
d'entités abstraites. Partant du concept d’un ensemble de 
choses comme famille de choses semblables entre elles 
(les oiseaux d'un même nid), ou différentes (une banane 
et un livre), nombreuses (les feuilles d’un arbre), moins 
nombreuses, réduites à une seule chose ou même à ren, 
il introduit le concept de nombre comme propriété d’un 
ensemble, en distinguant soigneusement dans la notation 
un ensemble, par exemple {crayon, balle} de son nombre 
N {crayon, balle}. Cette première initiation comporte les 
notions de plus grand, plus petit, plus long, plus court, 
plus haut, la notion d'égalité et la reconnaissance des 
formes géométriques semblables quoique de dimensions 
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différentes, enfin l'apprentissage des nombres, de 0 à 3 
dans un premier temps, puis jusqu'à 5. Le tout présenté 
sous forme de jeux dirigés pour susciter l'initiative dyna- 
mique et faciliter l'assimilation ultérieure des notions et des 
méthodes. 

On retiendra de ces exemples qu'un bon enseignement 
des notions élémentaires repose sur une analyse logique 
de ces notions et du contenu mathématique (compter, 
ajouter, retrancher, etc.) qui s'ensuit, d'où l'exigence pour 
les futurs enseignants du primaire et du secondaire de 
se former aux principaux concepts de la logique mathé- 
matique. 

Les programmes se concrétisent naturellement dans 
des manuels, et les bons manuels sont rares, si bien qu'ils 
apparaissent souvent comme l'expression d’une mathé- 
matique figée ou d'un enseignement dissocié de la 
recherche qui devrait pourtant le nourrir. Les pédagogues 
les ont, depuis un moment, tant critiqués qu'ils ont prati- 
quement disparu de l'enseignement au profit des fiches, 
fiches de notions et fiches d'exercices pour appliquer ces 
notions. 

Ainsi, dès 1929, Freinet condamnait le : manuel 
comme trop étriqué et trop scolastique et lui préférait 
le fichier, permettant un enseignement plus souple et 
faisant davantage appel à l'initiative tant du professeur 
que des élèves. Un ami de Freinet, R. Dutheil, a également 
attiré l'attention, dans un article de /'École libératrice 
(9 et 30 janvier 1932), sur l'arithmétique programmée 
de Winnetka, et les efforts suscités par ce genre de préoc- 
cupations aboutissent aux bandes enseignantes, auto- 
correctrices et complétées généralement par un test. 

L'avantage des fiches est qu'elles permettent de réindi- 
vidualiser la vie pédagogique, ce qui constitue le but de 
l'enseignement programmé. On a ainsi tenté une pro- 
grammation de l'algèbre élémentaire, et il existe également 
une arithmétique programmée présentée sous forme de 
fiches d'information et d'exercices de contrôle. Bien qu'il 
ait favorisé l'étude de tous les chaînons utiles dans un 
apprentissage, l'enseignement programmé ne semble pas 
avoir tenu toutes ses promesses; en particulier, il n’évite 
pas l'écueil de la présentation collective, par exemple, 
devant une classe d'enfants dont la maturité ou la rapidité 
d'assimilation n'est pas nécessairement uniforme, ni 
n'élimine vraiment l'idée de «l'écolier moyen » dont le profil 
détermine la constitution des fiches. 

Diversité des idées pédagogiques, multiplicité des 
méthodes, il y a de quoi rendre perplexes ceux dont la 
tâche est de former les futurs formateurs. « Comment 
concilier l'effort de l'éducateur sur lui-même pour s'ajuster 
à son rôle, et l'effort pour ajuster ses interventions à 
l'enfant et à son contexte social ? » se demandait J. Ferry. 
Plus on approfondit les problèmes pédagogiques, plus on 
s'aperçoit que, théoriquement, leur solution pose des exi- 
gences draconiennes dont les institutions actuelles ne 
permettent pas la réalisation harmonieuse. La situation 
est bien résumée dans cette remarque de R. Thom que 
nous citons : « Pour s'assurer que l'élève participe pleine- 
ment à la recherche en cours, il est nécessaire que le maître 
tienne compte à tout moment de ses réactions, afin 
de guider sa propre démarche et celle de son pupille. Ceci 
n'est guère possible, sous forme idéale, qu'en tête-à- 
tête. Dès qu'un maître a simultanément plusieurs élèves, 
il ne peut tenir compte des réactions souvent diverses 
de tous ses élèves, et il est amené à en négliger quelques- 
uns. Encore un pas de plus, et le souci d'efficacité le 
conduira à adopter une attitude de guide, et bientôt 
à revenir à l'enseignement ex cathedra. Aussi les efforts 
vers une pédagogie plus libre sont-ils nécessairement coû- 
teux : ils demandent plus de maîtres et des maîtres mieux 
formés, à personnalité originale : la société ne pourra qu'im- 
poser à ces efforts les bornes inéluctables du budget. » 

Au total, la pédagogie des mathématiques est-elle 
pour le moment autre chose que le bilan des difficultés 
inhérentes à la notion même d'éducation? autre chose 
que le constat du désarroi de l'éducateur qui, en principe, 
ne peut se contenter de tout organiser en fonction d'un 
système scolaire conventionnel, en négligeant les vir- 
tualités de ses élèves et les potentialités de changement 
de la société actuelle? L'enseignant, pris en tenailles 
entre des exigences peu compatibles, est la victime d'une 
situation de crise, provoquée par l'effondrement des 
idéaux humanistes et religieux, et qu'on n'a pas encore 
surmontée. 


HISTOIRE DES MATHÉMATIQUES 


L'historien des mathématiques se heurte aux difficultés 
de tout historien, du fait qu'il n'y a pas trace de tout ce qui 
s'est passé, que l'écrit lui-même n'est pas indélébile, que 
bien des éléments utiles à la connaissance historique ne 
furent consignés qu'après coup, après avoir traversé le 
flou du rapport oral, que les perspectives particulières, 
ou même les passions, ont souvent contribué à former 
une image plus conforme à la situation dans laquelle 
l'histoire était écrite qu'à la vérité, introuvable ou fragile. 
Tout se complique encore si l’on essaie de définir le sens 
de l'histoire des mathématiques du point de vue des 
mathématiques actuelles. Car, ou bien on discerne un 
lien entre les contenus actuels et passés, et on évite mal 
le risque d'appauvrir un contenu d'autant plus fuyant qu'il 
est dissocié de son contexte, ou bien on n'en discerne pas, 
et l'on se trouve face à des fragments auxquels il est ma- 
laisé de donner un sens en les rapportant à un contexte 
composé d'éléments hétérogènes. Un philosophe rigou- 
reux pourrait trouver dans l'entreprise même de tenter une 
histoire des mathématiques un vice fondamental, celui 
d'être un intolérable mélange des genres. Aussi n'avons- 
nous pas la prétention d'écrire, dans l’espace qui nous 
est imparti, une histoire qui aura surmonté toutes ces 
difficultés; mais ce sera assez de les circonscrire. Bien 
entendu, nous nous limiterons aux faits les plus prégnants, 
dans le cadre actuel de connaissances qui ne cessent de 
s'augmenter et de s'améliorer. 


Les mathématiques orientales 


Nous nous garderons de parler de « mathématiques 
préhelléniques » et laisserons entière la question de 


savoir dans quelle mesure la Grèce fut l'héritière de 
l'Égypte et de Babylone. Car rien ne démontre là cette 
continuité qu'on est tenté de supposer, sur le témoignage 
des Grecs eux-mêmes (Aristote ou Hérodote).On ne peut, 
en effet, étendre à toutes les périodes ce que Hilbert 
disait de la mathématique moderne, dont chaque moment 
pose des problèmes que l'époque suivante résout ou 
néglige comme stériles en leur en substituant d’autres. 
Mais, même si, avant elle, les méthodes primitives du 
compter et les nombreuses techniques ornementales qui 
utilisent des formes géométriques usuelles : points, lignes, 
carrés et losanges, cercles et spirales, portent la trace 
d'une pensée mathématique, c'est sans conteste aux 
antiques civilisations de l'Orient que revient le droit 
d'avoir inauguré cette science. 

L'Égypte 

Les sources dont nous disposons pour la connaissance 
des mathématiques égyptiennes ne sont pas très riches; 
elles se limitent aux papyrus fragmentaires du Moyen 
Empire (1900-1800 avant J.-C.) : papyrus de Kahoum 
et de Berlin, aux textes des fameux papyrus Rhind et de 
Moscou, à un court manuscrit du British Museum, aux 
deux tablettes sur bois du musée du Caire, enfin, aux 
scènes de la vie égyptienne qui nous montrent l'impor- 
tance des scribes, lorsqu'il s'agit par exemple de faire des 
mesures ou d'évaluer des récoltes. 

Le plus important de ces documents est le papyrus 
Rhind (du nom du Britannique qui l'a acheté en 1858 à 
Louxor et légué au British Museum). Comme presque 
tous les autres documents mathématiques qui nous sont 
parvenus, il date de la période des Iksos, rois d'origine 
asiatique implantés dans le delta du Nil au XVIII siècle 
avant notre ère. Composé par le scribe Ahmès, ce papyrus 
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À Les plus anciens 
documents mathématiques 
de la civilisation égyptienne 
remontent à une époque 
très lointaine; 

ces peintures murales 
ornant un tombeau royal, 
à Louxor, datant 

du XIIIe siècle avant J.-C., 
représentent 

des agriculteurs au travail 
dans un champ de blé 

et, en bas, des scribes 
effectuant des calculs. 


British Museum - Archives Edena 


À Le papyrus Rhind, 
d'après un traité égyptien 
de la XII dynastie. 

On y reconnaît 

des problèmes de fractions 
et des calculs de volumes 
et de surfaces 

(British Museum). 
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À Dans l'arithmétique 
égyptienne, les nombres 
s'écrivaient (sous forme 

de _hiéroglyphes) 
avec des signes spéciaux 
pour les unités, 

les dizaines... ( Fig. 1). 
Chacun de ces signes 
est répété autant de fois 
qu'il est nécessaire, 
pour exprimer le nombre 

désiré d'unités (fig. 2). 


5 Rés A. Ÿ res 
Entre DRE Sem 0) 


D pr) 


se présente comme une sorte de manuel. Le début du 
texte, prometteur, annonce qu'on va dévoiler l'essence 
de toutes choses. Mais, en fait, il s'agissait plutôt d'initier 
à un enseignement déjà codifié les scribes, devenus une 
sorte de caste indispensable à l'administration pharao- 
nique; or, prescriptions utilitaires et recettes techniques 
suffisent à ce but, et c'est précisément la forme qu'ont les 
problèmes (au nombre de 84, et de complexité croissante) 
du papyrus Rhind, ainsi que ceux (au nombre de 25) 
du papyrus de Moscou. Les énoncés arithmétiques ou 
géométriques qu'on y trouve appartiennent donc à des 
disciplines auxiliaires et utiles. 


L'arithmétique égyptienne 

Les nombres s’écrivaient (sous forme de hiéroglyphes) 
dans un système décimal, avec des signes spéciaux pour 
les unités, les dizaines, les centaines, les milliers, les 
dizaines de mille, les centaines de mille et les millions. 
En revanche, il n'y avait pas de signe pour zéro, bien qu'il 
soit pour ainsi dire indiqué par une place vide (fig. 1). 

Chacun de ces signes est répété autant de fois qu'il 
est nécessaire pour exprimer le nombre désiré d'unités, 
de dizaines, de centaines, etc., les chiffres les plus élevés 
étant écrits avant les autres (fig. 2). 

L'addition est une opération simple dans ce système; 
mais il n'en va pas de même pour la multiplication et la 
division qui ne se font directement que par 2. Le problème 
n° 32 du papyrus Rhind conduit ainsi la multiplication de 
12 par 12 (fig. 3). 

Le résultat final est donc la somme de 4 x 12 et de 
8 x 12 (— 144), les résultats à additionner ayant été 
cochés pour être distingués de ceux qui restent acces- 
soires. 
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1 (fois) : 12 
2 (fois) : 24 
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8 (fois) : 96 : 
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Bulloz 


La division est une multiplication inversée. Le n° 69 
du Rhind demande : « Additionne, en commençant par 80, 
jusqu'à ce que tu obtiennes 1 120 », ce qui veut dire qu'on 
cherche combien de fois 80 est contenu dans 1 120. 
L'opération 1 120 : 80 — 14 va être conduite comme 
une multiplication : 


1 80 
/ 10 800 
2 160 

| 4 320 
14 1120 


On additionne les résultats cochés. 
Quand le dividende n'était pas exactement divisible 
par le diviseur, on recourait aux fractions. Des fractions 


comme 


2°3 
usuelles et s'expriment par le signe & qui signifie « part 
de », par exemple : 


1 : is 
3 qui ont l'unité pour numérateur, sont 


a - : 
mais - a (seule) un signe spécial LL d 


8 
Les fractions n'ayant pas l'unité au numérateur sont 
décomposées; par exemple : 


1.0 21 y 1 

s 28 5 AUUTE 
Sur les fractions, le calcul se fait comme sur les nombres 
entiers, par le procédé de la duplication, mais on suppose 


parfois connues certaines relations immédiates, telles 
que : 


3 6 12 
qui sont utilisées comme des règles dans le calcul des 
fractions les plus courantes (1/2, 1/3, 1/6). 

Pour faciliter certains calculs, le papyrus Rhind donne 
une table de décomposition des fractions du type 2/n, 
pour ñn allant de 3 à 101, mais les techniques employées 
ne semblent pas se ramener à une méthode unique; cela 
constitue toutefois un des éléments les plus importants 
du contenu de ce papyrus. 

En bref, ces calculs contiennent beaucoup de problèmes 
qui sont pour nous du ressort des équations linéaires. 
Par exemple, l'expression x+3= 19 semble avoir un 
intérêt purement théorique et suggère la question desavoir 
si les Égyptiens ont, comme les Babyloniens à la même 
époque, utilisé le calcul algébrique. Mais on se trouve là 


devant une interrogation à laquelle on ne peut répondre. 

Le n° 40 du Rhind mérite aussi d'être cité, car il revient 
à partager 100 pains entre 5 hommes de façon que les 
parts forment une progression arithmétique; l'idée de 
progression arithmétique reste, bien entendu, très impli- 
cite dans les essais successifs qui aboutissent à la solu- 
tion. Celle de progression géométrique est également à 
l'œuvre dans le problème n° 79 qui demande la somme de 
ce que contient un domaine composé de 7 maisons, 
possédant chacune 7 chats, chacun des chats tuant 7 sou- 
ris dont chacune mangeait 7 grains d'orge, alors que cha- 
que grain aurait produit 7 boisseaux. Dans tous les cas, 
l'apparence pragmatique évidente fait ressortir ce qu'on 
pourrait appeler la profondeur mathématique implici- 
tement enfouie dans les outils utilisés. 


La géométrie égyptienne 

Pour les Grecs, l'Égypte était le berceau de la géomé- 
trie, qui leur semblait une science assez ancienne pour 
que Platon fit dire à l'Égyptien du 7imée (s'adressant à 
Solon) : « Vous autres Grecs, vous êtes toujours des 
enfants, vous n'avez aucune science blanchie par le 
temps. » Sans doute, la géométrie égyptienne n'est 
pas une science, au sens où les Grecs entendaient ce 
terme, mais plutôt un calcul appliqué, une pratique de 
l'évaluation des surfaces. C'est d'Hérodote que nous 
tenons l'idée que cette évaluation était indispensable 
à l'établissement de l'impôt. Mais nous pouvons cons- 
tater directement l'origine empirique de cette géométrie 
dans certains problèmes du Rhind, par exemple dans 
celui (n° 51) où l'on demande de calculer la surface d'un 
triangle de 10 verges de hauteur et 4 verges de base en 
prenant la moitié de 4 pour en faire un rectangle et en 
multipliant 10 par 2. C'est donc en prenant la surface du 
rectangle construit sur la moitié de la base du triangle 
(et ayant comme longueur la hauteur du triangle) qu'on 
a la solution cherchée. Tout semble indiquer, justement, 
que le rectangle est la figure de base à partir de laquelle 
on calcule l'aire du triangle rectangle, puis du triangle 
isocèle, enfin celle du trapèze (fig. 4). 

Le papyrus Rhind nous donne une approximation de 


9 
du diamètre, ce qui revient à l'évaluation suivante pour 7: 


Tr = É) - 


Ce calcul étonnant de + est à l'origine de nombreuses 
spéculations. Gaston Milhaud l'attribuait ainsi à l'effi- 
cacité d'un procédé qui ne nous serait pas parvenu, ce 
qui implique l'idée, parfois défendue, d'une science égyp- 
tienne vivante, par rapport à laquelle les recueils de pro- 
blèmes que nous connaissons ne représenteraient que des 
formes cristallisées, figées et comme pétrifiées. Cette 
impression se renforce quand on remarque que le papyrus 
de Moscou livre la formule exacte pour calculer le volume 


l'aire du cercle, qui est considérée égale au carré des 


3,160 49... 


du tronc de pyramide : V = (82 + ab — b?), laquelle, 
comme le note Wan der Waerden, ne peut être calculée de 
manière purement empirique et résulte probablement de 
quelque considération théorique (fg.5). 

Malheureusement, on en est réduit à des conjectures, 
bien que l’on puisse imaginer des constructions rendant 
compte des formules sans induire des hypothèses dont le 
niveau dépasse celui qui nous apparaît aujourd'hui : rien 
ne permet de définir la réelle profondeur des formes 
condensées dans lesquelles nous sont parvenues les solu- 
tions des problèmes de la mathématique égyptienne. On 
retiendra donc que cette mathématique nous est parve- 
nue à travers une collection d'exemples de problèmes, 
sans qu'il y soit jamais question de démonstration. En 
outre, il ne semble pas qu'elle ait connu une évo/ution ou 
un progrès quelconque durant tout ce temps où elle fut 
principalement l'outil des architectes, des arpenteurs et 
des maîtres calculateurs. Mais ni le calcul, ni l'arpentage 
ne suffisent, dit-on, à créer une véritable « science ». 


La Mésopotamie 


Le pays qui s'étend entre le Tigre et l'Euphrate dévelop- 
pait, depuis des millénaires également, une civilisation 
agricole et urbaine. Mais, avec l'arrivée des Sumériens, 
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rectangle ee rectangle 


Tronc de pyramide de hauteur h et dont la base 
est un carré de côté a; b est le côté du carré sui- 
vant lequel est faite la section de la pyramide. 
Empiriquement, on peut subdiviser le tronc de 
pyramide en parallélépipède, 2 prismes et 1 pyra- 


peuple aux origines inconnues, venu du golfe Persique, 
s'épanouit une culture originale qui va durer jusqu'à 


l'aube de l'ère chrétienne. Vers 2200 avant J.-C. les 
Babyloniens, venus du nord du pays, soumettent les 
Sumériens et étendent leur empire jusqu'à la Méditerra- 
née. Ils fondent la dynastie akkadienne, avec Babylone 
pour capitale, mais les « vaincus ayant conquis les vain- 
queurs », la culture sumérienne continue de s'épanouir. 
Elle atteint son acmé durant la dynastie de l'illustre légis- 
lateur : Hammourabi (vers 1780 avant J.-C.). 

Un peu plus tard, se développe en Assyrie une autre 
civilisation remarquable, tributaire des Sumériens et 
des Akkadiens, mais douée également d'une puissante 
originalité. C'est elle qui dominera, en fin de compte, la 
région, car elle saura mieux se défendre contre les envahis- 
seurs, contre les rivaux politiques de Babylone, et attein- 
dra son apogée au VII® siècle. Aussi avons-nous de 
cette culture des traces relativement tardives, proches du 
début de l'ère chrétienne, bien qu'elle ne survive plus 
à ce moment que dans les temples où les textes cunéi- 
formes résistent à l'invasion de la langue du Perse 
vainqueur. 


La notation numérique 

Ce degré d'abstraction atteint par la science suméro- 
akkadienne est attesté avant tout par l'apparition de 
l'écriture cunéiforme, qui implique les notions d'idéo- 
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a.h h 
_—_—_— = — + 
S = 2 S 2 (a + c) 
triangle | 
fig. 4 isocèle trapèze 
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À En haut, 

problème de géométrie 
égyptien, antique, 

et sa traduction 

en caractères dénotiques. 
Ci-dessus, figure 4 : 
calcul des aires 

du triangle rectangle, 
du triangle isocèle 

et du trapèze 

à partir du rectangle, 
expliquant un problème 
du Rhind. 


<« Figure 5 : 

schéma dû à O. Neugebauer 
pour expliquer le calcul 

du volume du tronc 

de pyramide du papyrus 

de Moscou. 


« Page ci-contre, 

à gauche, figure 3 : 

la multiplication de 12 
par 12 telle qu'elle est 
conduite dans le papyrus 
Rhind. 

A droite, 

Le scribe accroupi 
(musée du Louvre, Paris). 


Richard Colin 


Roger Viollet 


Tableau I - Système de numération babylonienne 


dir. CI eos l 
: Te 20, 70: < 
M | ei ot: QT] 80: 1& 
9 
0 


120: || 


180: []! 
200 : [[T{{ 


2 
8: II A OR I) etc. 
a "4 10: « 40: £< 100: << 
5: Ÿ] 00) 50: $£< | 101: JS 


Dans la pratique : 60 dE | (1 SU = une soixantaine) — 100 TT 


(1 ME = un cent) — 1.000 : [{f> (1 LIM = un millier). 


Fractions : Système savant : 1/2 :(({(30/60) ; 1/3 : € (20/60); 


1/4 :(ÿf (15/60); etc. 
Dans la pratique : 1/2 +1; 1/3 : M ; 2/3 l;5/6:1;1. 
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À Tableau l: 
la numération babylonienne. 


nale : 


Ÿ Figures 6, 7,8: 


exemples a : | DR TES 
d'opérations arithmétiques  POSitionnelle, généralement répandue dans l'Antiquité, 
babyloniennes. en particulier chez les Romains. Par exemple, dans 444, 


Exemple d’addition signifie 14 


2 à 
a 


fig. 7 
É Symbole de soustraction Ï 
Exemple de soustraction 
B=— 
10- 4 s'écrit: 4 | ] [ Fan 
fig. 8 Symbole de multiplication 


1e, 


Exemple de multiplication 


Nr ee 


AA 
T 


7 fois 1 est noté : 
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gramme et de valeur syllabique, et, en ce qui concerne 
les mathématiques, par une connaissance théorique des 
principes justifiant les solutions admises, bien que cette 
connaissance ne soit pas développée dans les textes 
qui en constituent l'application, et qui ont été découverts 
pour partie dès 1854 par Senkereh, pour partie en 1894. 

La numération babylonienne est doublement origi- 
c'est une numération de position, et sa base est 
sexagésimale. La notation positionnelle fait dépendre 
la valeur d'un signe numérique de la p/ace qu'il occupe 
dans le nombre et se différencie ainsi de la notation juxta- 


le 4 signifie selon sa place aussi bien 4 unités que 4 dizaines 
où 4 centaines. Ce système permet l'expression aisée de 
nombres très grands ou très petits et facilite les opérations. 
Cette numération sexagésimale repose sur deux symboles 


particuliers : 
4 = =: 10 


mais l'unité Woout aussi bien signifier 1 que 60, ce dont 
seul le contexte permet de décider (tableau |). 

De même peut aussi bien désigner 10 : 60. Autre- 
ment dit, le besoin de disposer d’une notation pour le zéro 
se fait sentir, mais cette lacune n'est pas comblée. 

Il semble que ce soient les Sumériens qui, après un 
essai de notation ternaire, aient inventé ce système sexa- 
gésimal qu'on retrouve dans leur métrologie et dont l'ori- 
gine pourrait apparaître dans l'échange, l'orge, puis 
certains métaux servant de base aux transactions. Nous 
avons conservé aujourd'hui ce système dans notre parti- 
tion de l'heure en soixante minutes, de la minute en 
soixante secondes, et dans notre mesure en degrés des 
angles. A cet égard, l'adjonction du zéro achève ce système 
et le rend propre aux applications astronomiques aux- 
quelles procédait Ptolémée. 


Les opérations arithmétiques 

Les fractions ne jouent pas ici le rôle qu'elles avaient 
dans l'arithmétique égyptienne, la base sexagésimale per- 
mettant de se limiter souvent à des nombres entiers: 
mais elles ne sont pas totalement absentes, et l’on trouve 
même dans deux tablettes une tentative de noter les 
fractions par « numérateur » et « dénominateur ». 

L'addition est exprimée par la juxtaposition des sym- 
boles (fig. 6). Mais la soustraction est signifiée par un 
symbole particulier (fig. 7). 

La multiplication possède également un signe assez 
complexe (fig. 8). 

La multiplication utilise d'abord des tables qui contien- 
nent les produits par un nombre, a, des vingt premiers 
nombres et de 30, 40 et 50, ce qui suffit à donner le résul- 
tat du produit par a d'un nombre quelconque compris 
entre 1 et 60. Mais, pour multiplier par 37, par exemple, 
on multiplie par 30, puis par 7, et l’on additionne les 
résultats. 

Pour diviser b par 4, on cherche d'abord 1/a, puis on 
multiplie cet inverse par b. C'est pourquoi aux tables de 
multiplication sont souvent associées des tables pour 
les inverses. 

Les documents nous ont légué encore des tables de 
carrés, de racines carrées, de cubes et de racines cubiques, 
indiquant, s'il y a lieu, la valeur exacte d'une racine, ou, 
à défaut, une approximation. On a ainsi une excellente 
approximation de Ÿ2 = 1,414 213... Lestablettes contien- 
nent aussi des séries arithmétiques et géométriques finies, 
des relations exponentielles et logarithmiques. La somme 
d'une série géométrique de raison 2 et ayant 10 termes est 
calculée ainsi : 


112444, 480% (0 


1) = 2107, 
ga — 1 


résultat qui est celui de la formule connue S = a se 


pourg=2,a—=1etn— 10. 

Naturellement, nous avons renoncé, pour des raisons 
de place, à exposer l'histoire interne de la numération 
et de l'arithmétique telles qu'elles se sont développées 
dans les différentes civilisations mésopotamiennes, et à 
souligner les efforts locaux qui en ont marqué les diffé- 
rentes étapes. 


L'algèbre 

Il s'agit essentiellement de l'apparition, sinon de la 
théorie, des équations linéaires, quadratiques, voire 
biquadratiques et cubiques, du moins de ces équations 
elles-mêmes sous une forme si scientifique qu'elle semble 
l'application directe d'une théorie. La préoccupation 
pratique semble bornée à un rôle somme toute secondaire: 
elle est soit le support d'un exercice ou d'une application, 
soit l'auxiliaire gardant le privilège de l'illustration et de 
l'exemple. Lorsque, sur une tablette, on demande de 
trouver le côté d'un carré dont la surface « additionnée 
six fois et le côté trois fois et demie » vaut 906, l'indication 
qu'il s’agit de « mon champ » montre qu'il s’agit, non pas 
d'un problème pratique, mais d'un exercice théorique 
sur un thème mathématique donné. 


Nous donnerons un exemple de résolution d'une équa- 
tion du second degré (problème 7, tablette BM 13901), 
tel qu'il est exposé par Labat et Bruins dans /a Science 
antique et médiévale (P.U.F., 1966, p. 113) : «J'ai ajouté 
sept fois le côté de mon carré et onze fois la surface : 
cela fait 6,15. Pose 7 et 11. » Ce qui veut dire : posons 


11x2+7x= 6,15. 


Le texte babylonien prescrit les démarches suivantes : 
« Multiplie 11 par 6,15 : 1 : 8,45 (1 : 8,45 — 68,75 en 
notation décimale). Prends la moitié de 7, 3,30 (ou 3,50 
en notation décimale). Multiplie 3,30 par lui-même : 
12,15 (= 12,25 en notation décimale). Ajoute 12,15 
à 18,45 : 1 : 21 (— 81 en notation décimale). La racine 
de 1 : 21 est 9. Ote 0,30 que tu as multiplié de 9 : 5,30. 
L'inverse de 11 n'est pas dans les tables. Par quoi faut-il 
multiplier 11 pour avoir 5,30 ? par 0,30 (— 0,50 en nota- 
tion décimale). 0,30 est le côté de mon carré. » 

Cela revient à considérer l'équation de la forme 


ax? + bx+c =0 


suivante : 11 x2 + 7 x— 6,15 = 0, et les opérations 


suivantes : 
11 X 6,15 = 1 : 8,45 qui correspond à a : c° 


7,2 = 3,30 qui correspond à 8 


2 
À 5 2- 12,15 qui correspond à &) 
12,15 + 18,45 — 1:21 qui correspond à +4ac —E ac” 
1,21 = 9 qui correspond à DERTTS 
9 — 3,30 — 5,30 qui correspond à Er. 7 


Les Babyloniens avaient également une certaine idée 
de la notion de fonction, qui est généralement et à juste 
titre considérée comme la notion la plus caractéristique 
des mathématiques modernes. Pour la résolution de 
l'équation cubique x3 + x? — O0, une tablette donne ainsi 
la liste des nombres correspondants, pour chaque valeur 
de n, à mn + n?. 
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La géométrie 

L'exposé en est également fait par schémas de solutions 
plutôt que par voie démonstrative au sens où nous l'en- 
tendons depuis les Grecs. Elle est dominée par une ten- 
dance algébriste, dans la mesure où ne sont mobilisés 
que les résultats susceptibles de conduire à des relations 
métriques; les notions d'angle et de parallèle, une rela- 
tion comme a/b = c/d n'ont pas de termes pour les 
exprimer, tandis que la relation « de Pythagore » qui 
exprime un rapport métrique entre les côtés d'un triangle 
et sa diagonale est déjà connue (mais c'est Pythagore 
qui la démontrera). D'où la conclusion de Bruins : « A 
mon avis, il ne faut pas attribuer aux mathématiciens 
babyloniens la connaissance de la théorie géométrique 
des proportions, bien qu'ils montrent des relations numé- 
riques qui correspondent aux théorèmes de cette théorie. » 

Parmi les problèmes où est impliquée la relation de 
Pythagore, citons un exemple. On donne les relations : 


L+/+1d—=40 et L:/=2:0 


(= 120 en système décimal) entre la longueur L, la 
largeur / et la diagonale d d’un rectangle; le scribe résout 
le système des 2 équations sans indiquer qu'il suppose 
également donnée : d?— L2 + /2. 

Lorsque l'application de la relation de Pythagore n'est 
pas possible, la valeur de la diagonale étant irrationnelle, 
les scribes tentent de trouver une approximation, en uti- 


lisant la formule : 
2 1 ni 
2a 2 (e 1 2) 


On trouve évidemment dans les tablettes des problèmes 
portant sur des surfaces telles que des carrés, des rec- 
tangles, des trapèzes, etc., et sur des volumes tels que 
des cubes, des parallélépipèdes et des polyèdres. Il 
s'agit toujours d'une théorie essentiellement numérique. 
Ainsi un calcul, appliquant la formule 

(a+2X 1(a— 2x] 
2 "13 2 
donne le volume du tronc de pyramide. 

De manière générale, l'évaluation des surfaces n'est 
pas très scrupuleuse, sauf dans les formules concernant 


des carrés, des rectangles et des triangles rectangles. 
Bref, les Babyloniens ont connu une théorie numérique 


\x= V8 +2=a 


v=hl 
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À A gauche, 

une tablette cunéiforme, 
vestige de la civilisation 
mésopotamienne 
(Bagdad, Musée irakien). 
A droite, 

tablette cunéiforme, 
d'origine babylonienne, 
contenant un texte 
mathématique 

et un dessin géométrique 
(Bagdad, Musée irakien). 
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L 2 3 4 


1 


FL 


200 500 


1 


À Tableau Il : 
principales notations 
numérales indiennes 
antiques. 


> Tableau Ill : 

la numération chinoise 

de 1 à 10 établie 

à partir de documents 
datant de 1400 avant J.-C. 


Tableau II - Notations numérales indiennes antiques 


Chiffres araméo-indiens anciens 


} D JE HEX DIX AN DIN 9 
5 


Chiffres araméo-indiens (II° siècle après J.-C.) 


AA AE 4 2 Bree 


Chiffres indiens (lII® siècle avant J.-C.) 


+ € 6-) 


Chiffres indiens (I°' et II® siècles après J.-C.) 


MR SC Ne 


1000 2000 3000 4000 8000 70 000 


Notation décimale médiévale du Kashmiîr (manuscrit de Bakhshâfi) 


AR, dd AE CP 
20 13 04 BD Gt 07 891 29 


PANTIN 


6 8 9 10 11 20 30 50 100 


10 100 1000 


& &GE 


200 256 


9 10 20 40 70 80 100 


M dr 


0 


des polygones réguliers; ils étaient familiarisés avec les 
concepts de centre et de rayon d'un cercle; ils n'ont pas 
de théorèmes sur des figures semblables, mais utilisent des 
méthodes qui procèdent, selon Bruins, « de l'application 
de la propriété de l'équidistance des droites parallèles et 
de l’additivité des aires ». 

Parrapport à la mathématique égyptienne, une «avance » 
certaine perfectionnement du calcul, apparition de 
procédés algébriques, usage de méthodes d'approxima- 
tion et utilisation d'une géométrie à vocation essentiel- 
lement numérique, algébrique. 


La mathématique indienne 


En Inde, l’activité scientifique, qui a un caractère sacré, 
commence dès le milieu du second millénaire avant J.-C. 
Bien que nous ne possédions aucun traité spécial de 
mathématiques qui remonte aux périodes les plus ancien- 
nes (c'est-à-dire surtout védique et brahmanique), 
la langue védique apparaît déjà familiarisée avec le manie- 
ment des grands nombres : puissances de 10 jusqu'à 1023. 
Les indications que nous possédons concernent la géo- 
métrie, science indispensable pour la construction des 
autels védiques. Les Culva-sûtra, ou « aphorismes sur les 
cordeaux », sont spécialement consacrés aux règles de 
construction de ces autels ; ils remontent à 700 avantJ.-C., 
mais ne nous sont connus que d'après des rédactions 
ultérieures, qui se situent aux alentours de l'an 300 
de l'ère chrétienne. Là aussi, nous avons affaire à une 
géométrie numérique. La relation de Pythagore y inter- 
vient souvent sous la forme : « La corde transversale d'un 
rectangle produit (par construction sur elle d'un carré) 
ce que produisent séparément la longueur et la largeur. » 

La numération décimale et le zéro, propagés par les 
Arabes, n'apparaissent pas en Inde avant le Moyen Age. 
Le tableau 11 donnera une idée de l'évolution de la nota- 
tion numérique indienne; on en retiendra essentiellement 
que c'est l'Inde qui a inventé le système de numération 
à 9 chiffres et zéro, qui est devenu universel. 

C'est très tôt, au contraire, que la mathématique indienne 
connaît les approximations, trait qu'elle partage avec 


la mathématique babylonienne; ainsi V2 s'évalue de la 


| 1 1 
façon suivante : 1 FEES Sin 1,4142 
, 62 832 . 
On trouve aussi : 7 æ 30 000 — 3,141 6, exprimé sous 
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la forme : « Soixante-deux mille huit cent trente-deux 
est approximativement la circonférence dont le diamètre 
est vingt mille. » 

La constitution d'une mathématique classique, impliquée 
dans des applications astronomiques, atteste, en algèbre, 
la capacité de résoudre par les fractions continues deux 
équations simultanées indéterminées du premier degré; 
mais ce résultat, consigné dans l'Aryabhatiyam d'Arya- 
bhata (mathématicien et astronome vivant vers 476 
après J.-C.), est largement dépassé par l’astronome du 
VIIS siècle Brahmagupta, qui parvient à une méthode 
pour trouver les solutions entières d'une équation indé- 
terminée du second degré. 


La mathématique chinoise 


Les textes de la Chine ancienne qui nous ont été 
conservés, gravés sur des os, sont souvent d'inspiration 
divinatoire. Des nombres y sont notés, mais on ne trouve 
pas de liste exhaustive pour les chiffres utilisés, non 
plus que l'indication d'opérations sur ces nombres. Certes, 
il s'agit de documents anciens, remontant jusqu'à 1400 
avant J.-C. Leur étude permet cependant d'établir le 
tableau III qui donne les nombres de 1 à 10. 

Mais on ne possède pas pour les époques anciennes 
de notation systématique, et nous ne savons pas comment 
étaient notés effectivement des nombres comme 16, 
17, 18 ou 19. En revanche, on a une notation pour les 
dizaines et pour les centaines. 

Il s'agit donc d'une numération qui ne groupe pas 
toujours unités simples et puissances de la base 10, et 
qui ne s'est pas bien libérée de la numération parlée, 
qu'elle ne fait souvent que transcrire. 

Si l'usage des nombres en Chine remonte à la préhis- 
toire, des opérations sur les nombres nous ne savons pas 
grand-chose avant le Ill siècle de l'ère chrétienne. 
Addition et soustraction se font alors directement grâce 
à une représentation des nombres par de petits bâtonnets 
ou jonchets qui remplissent le même rôle que les 
calculi (petits cailloux) latins; on les ajoute ou retranche 
colonne par colonne. 

L'utilisation des jonchets sur une table permettait de 
figurer un nombre, rapporté comme on l'a indiqué à une 
base décimale, par une numération de position analogue 
à celle que nous employons actuellement avec nos chiffres 
arabes (tableau 1V). 

Pour multiplier, on posait le multiplicateur en haut et le 
multiplicande en bas de la tablette; les produits partiels 
posés sur la ligne intermédiaire étaient additionnés au fur 
et à mesure de leur obtention. De facon analogue, la 
division était conduite en posant le diviseur tout en bas, 
le dividende sur la ligne moyenne, et le quotient en haut. 

La géométrie ancienne chinoise ne nous est connue que 
par les écrits de l'école de Mo Ti, qui définissent le point 
et la droite. Ailleurs, on ne se préoccupe que du calcul des 


Tableau III - Système 
. de numération chinoise 
ancienne 


Ecriture Nombres cardinaux 
courante 
en Prononciation 


chiffres 
[scan | odme 


arabes 
?ièt 


ni 
säm 
s? 
’ngo 
liuk 
ts’ièt 
pat 
’kiôu 
Zip 


+ HE ||] | 


1 
2 
3 
4 
5 
6 
tu 
8 
9 
0 
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surfaces. Toutefois, des exemples simples de nombres 
pythagoriques (3, 4, 5, la somme des carrés de 3 et de 4 
étant égale au carré de 5) apparaissent, de même qu'une 
grossière évaluation de 7 (= 3). 

A l'époque des Han (de 202 avant J.-C. à 220 de 
l'ère chrétienne), apparaissent des traités de calcul, avec 
une arithmétique concrète des nombres rationnels et 
irrationnels approchés, des équations linéaires à coeffi- 
cients numériques, et le plus remarquable des systèmes 
de n équations linéaires à n inconnues, constituées en 
calcul algébrique sur l’échiquier, et dont voici un exemple 
pour le cas n = 3: 


x+2y+3z= 26 
2x+3y+ z— 34 
3x+2y+ z= 39 


Cet exemple est représenté matriciellement par la figure 9. 

La résolution était donc faite par manipulation de 
jonchets, avec des jonchets de couleur pour les nombres 
positifs (« corrects ») et des jonchets noirs pour les nom- 
bres négatifs (« trompeurs »). 


La mathématique maya 


La civilisation maya a connu un système de numération 
positionnelle, de base 20. Les unités de 1 à 4 étaient notées 
par des points, ainsi que les vingtaines, et certains autres 
nombres comme 400 (20 x 20), 8 000 (400 * 20),etc.; 
cinq et ses multiples étaient notés par des barres. Les 
nombres 560 (28 x 20) et 7 200 (360 *x 20) sont remar- 
quables parce qu'ils sont au principe de la partition de 
l’année maya en 18 mois de 20 jours, auxquels on ajoutait 
un complément annuel de 5 jours. 


Conclusion 


Le caractère général de toutes les mathématiques que 
nous venons de considérer rapidement, chacune replacée 
dans son aire culturelle spécifique, est double : il s’agit 
d'une mathématique toujours à la fois utilitaire et sacrée. 
La géométrie des Égyptiens est ainsi née entre les mains 
des harpédonaptes, de ceux qui « attachent le cordeau », 
c'est-à-dire les arpenteurs. 

Mais ces arpenteurs étaient surtout préoccupés par le 
problème de l'orientation des temples, en relation étroite 
avec la religion égyptienne. L'arpentage lui-même est, 
en fin de compte, l'œuvre des prêtres; pratique rituelle 
et pratique manuelle ou concrète sont intimement asso- 
ciées. De manière générale, dans chacune de ces civili- 
sations anciennes, la pensée mathématique était conçue, 
et c'est peut-être tout à leur honneur, de façon à s'inscrire 
strictement dans l'horizon propre de leur culture, de leur 
vision du monde, de l'idée qu'elles se font des rapports de 
l'homme et du monde, avec tout ce que cela comporte 
d'imbrications mutuelles entre le rite, la pratique et cet 
outil qu'est le calcul. 


La mathématique grecque 


Il est admis qu'avec la mathématique grecque, c'est 
l'idée d'une science autonome qui s'affirme, une science 
vivant de sa vie propre, dégagée des techniques et des 
rites, capable de se définir, de se distinguer, de se conce- 
voir, au sens propre d'une théorie. 

Mais cette mathématique ne s'est pas constituée telle 
quelle d'un seul coup. 


Les commencements de la mathématique 

Ils remontent à la fondation, généralement attribuée 
à Thalès, de l’école de Milet. Thalès aurait vécu à la 
fin du VIle siècle et au début du VIe, environ de 639 à 
546 av. J.-C. On raconte qu'il avait prédit une éclipse 
solaire, indiqué, le premier, la cause des éclipses, esquissé 
une première explication rationnelle de l'Univers en le 
réduisant à un élément unique : l’eau, génératrice des 
autres éléments. Si l’on en croit la tradition, Thalès aurait 
rapporté les premières connaissances mathématiques de 
ses voyages en Égypte. Proclus rapporte que « Thalès, 
le premier, ayant été en Égypte, en rapporta cette théorie 
[la géométrie] dans l'Hellade; lui-même fit plusieurs 
découvertes et mit ses successeurs sur la voie de plu- 
sieurs autres, par ses tentatives, tantôt plus générales, 
tantôt plus restreintes au concret ». 

Une autre tradition, qui remonte à Eudème mais est 
souvent reprise après lui, lui attribue la solution des pro- 
blèmes géodésiques suivants : calcul de la distance d'un 
navire à la côte et calcul de la hauteur d'une pyramide 
d'après l'ombre portée. 

Ce qui est certain, c'est qu'à l'époque de Thalès, on 
devait disposer du concept d'angle, élaboré probablement 
en Grèce. L'attribution à Thalès des propositions d'après 
lesquelles le diamètre partage le cercle en deux parties 
égales, les angles à la base d'un triangle isocèle sont 
égaux, les angles opposés par le sommet égaux et l'angle 
inscrit dans le demi-cercle droit, est très plausible. 
Ces propositions correspondent respectivement à la 
définition 17 et aux propositions 5, 15 et 31 du premier 
livre d'Euclide. 

Ainsi, Thalès s'est occupé avant tout des propriétés 
des angles, et la rupture qu'il a opérée avec la tradition 
égyptienne consiste essentiellement en ce qu'il a créé 
ce qu'on pourrait appeler une géométrie de la ligne, 
par opposition à la géométrie égyptienne, si absorbée 
par le calcul des aires. « Thalès, écrit Diogène, développe 
tout ce qui touche à la considération des lignes », ou, 
comme dira Apulée, des « petites lignes », c'est-à-dire 
que Thalès développe une étude géométrique sur figures, 
et non plus sur le terrain, centrée sur le concept de simi- 
litude, dont Bruins nous dit qu'on peut vainement le 
chercher dans une mathématique aussi développée que 
celle des Babyloniens. 

Quoi qu'il en soit, le nom de Thalès reste attaché à 
la première mathématique qui avait pris son essor sous 
l'égide philosophique de la fameuse école de Milet. 

Celle-ci fut suivie par l’école des loniens, aux destinées 
de laquelle présidait Pythagore. D'après Proclus, qui s'au- 
torisait du témoignage d'Eudème, c'est Pythagore qui 
transforma la géométrie par un « enseignement libéral », et 
rechercha les théorèmes abstraitement et par l'intelligence 
pure. Pythagore est resté célèbre par sa doctrine qui ensei- 
gnait que « toutes choses sont nombres », principe en 
lequel se résume le pythagorisme, et qui traduit toute 
son ambition : exprimer en formules arithmétiques tous les 
phénomènes. Nonobstant les aberrantes exagérations 
auxquelles elle a donné lieu, cette ambition valut à 
l'arithmétique pythagoricienne de s'élever au rang privi- 
légié d'une science à caractère spéculatif. En effet, avant 
de dire que les choses s'expriment par des nombres, 
le pythagorisme avait commencé par considérer les 
nombres eux-mêmes comme des réalités tangibles et 
intelligibles. Nous verrons comment les pythagoriciens 
figuraient les nombres, après que nous aurons dit un 
mot de la numération grecque. 


La numération grecque 

La numération grecque a procédé de deux systèmes. 

e Le système hérodien, attesté dès 554 avant J.-C. 
ressemble au système romain que nous connaissons et 
présente les mêmes inconvénients que lui : il ne se prête 
pas à l'expression d'une arithmétique un peu avancée. 
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À Figure 9 : 

représentation matricielle 
d'un système de 3 équations 
à 3 inconnues, 

dont la résolution 

se faisait par manipulation 
de jonchets. 


< Tableau IV : 

la représentation 

des nombres se faisait 
au moyen de petits 
bâtonnets ou jonchets. 
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Snark International 


L'école de Pythagore, 
à Croton, 

d'après une gravure 
du XIXe siècle. 


1=i 10 — A 50 — FA 
2=1II 100 = H 5 000 = 
3—1III 1 000 = X 
5—II 10000—M 


© Le système milésien, né vers le milieu du V® siècle, 
est plus propre à l'usage savant. Il emploie l'alphabet grec, 
augmenté, pour les besoins de la cause, de trois lettres 
auxiliaires anciennes : 6 Get À. 


1=x 10= 4 100 = 5 
2=8 20 = x 200 = 5 
3— 7 30 = x 300 = = 
4=5 40=% 400 = 0 
D=e 50 = v 500 = © 
= 60 = 600 = + 
= 70=0 700 = Ÿ 
= 80 = = 800 = © 
9=8 90 = £ 900 = À 


Ce système a subi des modifications qui lui ont permis 
d'exprimer de très grands nombres dans l'Arénaïre 
d'Archimède, on considère, par exemple, le nombre 
108 + 108. Pourtant, ce n’est pas par l'amélioration del’écri- 
ture numérique que les Grecs ont marqué l'arithmétique : 
ils ne sont parvenus ni à un système positionnel pur, ni à 
l'adoption systématique et fructueuse du zéro. Leur origi- 
nalité est ailleurs, et s'affirme, précisément, dès Pythagore. 
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L'arithmo-géométrie des pythagoriciens 

L'école pythagoricienne était située à Croton, en Italie 
du Sud (580-501 avant J.-C.). L'enseignement, réservé 
aux «initiés », était oral et n'a pas laissé de trace écrite. 
Nous connaissons l'œuvre des pythagoriciens par des 
écrits postérieurs, de Platon et d'Hérodote notamment. 

Les découvertes attribuées à cette école convergent 
pour établir que c’est là qu'est née l’idée de remonter aux 
principes supérieurs et de démontrer abstraitement, c'est-à- 
dire en usant de procédés purement discursifs. 

La distinction entre nombres pairs et impairs s'effec- 
tue alors, ainsi que le classement des nombres d'après 
des propriétés arithmo-géométriques, c'est-à-dire d'après 
une architecture discontinue des unités-points. La recon- 
naissance des nombres parfaits manifeste ainsi la structure 
interne des nombres par l'observation des propriétés des 
figures qui les représentent, et s'accompagne de l'indica- 
tion explicite de procédés opératoires permettant de 
composer les nombres entiers selon une /oj. Les nombres, 
points ou cailloux sur le sable, sont ainsi c/assés selon 
l'arrangement des points ou cailloux. On distingue ainsi 
plusieurs types. 

@e Les nombres triangulaires, qui sont les exemples les 
plus simples de séries arithmétiques finies. 1, 8, 6; 10; 
par exemple, sont des nombres triangulaires : 


e L2 e e 
e L e L e e 
L2 L e e e e 
1 3 6 10 


On connaît les cas particuliers simples de la loi que nous 
exprimons aujourd'hui par : 


| n(n+1) 
RD SE A pre NE EUR 
1 - 3 -n 5 

e Les nombres carrés, tels 1, 4, 9, 16, etc. 
L] L e L] L] 
L e e e e e 
o 0 e e 
e e L2 e 

1 4 9 16 


Les carrés sont des sommes de nombres impairs, par 
exemple:9—=1+132165;: 16—1 + 3+5+ 7; bref, 
on connaît des cas particuliers de la loi: 


1+3+5+..+(2n—1)=n2 


On voit aussi que tout nombre impair est l'expression de 
la différence entre deux carrés ayant respectivement pour 
côtés deux entiers consécutifs : 


5= 32 22, 7 — 42-32, etc. 


Le passage d'un carré au suivant s'effectuait concrète- 
ment chez les pythagoriciens à l'aide du gnomon (dont 
le terme est emprunté aux Babyloniens), et que l’on peut 
représenter par la figure formée par les points supplé- 
mentaires sur le schéma ci-dessous : 


e Les nombres hétéromèques où rectangulaires : deux 
nombres sont dits hétéromèques quand leur différence est 
égale à 1. 

On sait que la somme des nombres pairs consécutifs est 
le produit de deux nombres hétéromèques, c'est-à-dire 
qu'on connaît des expressions particulières de la loi : 


2+4+6+.. 
pour 7 = 3, on a la représentation suivante : 


2n=n(n—1); 


@ Les nombres polygonaux : pentagonaux, hexago- 
naux, etc. | 
Nombres pentagonaux :1,5,12, 22, … le n-ième étant 
3n—n, 
5 : 


Nombres hexagonaux : 1, 6,15, 28, … le n-ième étant 
2n—n: 


e Les nombres parfaits sont ceux qui sont égaux à la 
somme de leurs diviseurs; par exemple : 


6=1+2+3; 28=1+2+4+7-14 


Les nombres composés (— non premiers) et non par- 
faits sont dits ob/ongs. 

e Le concept de moyenne harmonique qu'Archytas 
définissait comme « la médiété (on appelle médiété une 
progression de trois termes tels que deux d'entre eux et 
deux de leurs différences soient dans le même rapport) 
dont les trois termes sont tels que, quelle que soit la 
partie de lui-même dont le premier dépasse le second, 
le second surpasse le troisième de la même partie de ce 
troisième ». Autrement dit, si la différence du moyen au 
petit terme est une fraction donnée du petit terme, il 
faut que la différence du moyen au grand soit égale à la 
même fraction du grand terme; par exemple, 6, 4 et 3 
forment une médiété harmonique, puisque 4 surpasse 3 
du tiers de 3 et est surpassé par 6 du tiers de 6. 

Plus généralement, pour trois nombres a, b, c tels que 
a > b > c, on a une médiété harmonique si : 


OO 


c b b a 

L'origine de la dénomination « harmonique » est musicale. 
C'est un témoin des anciennes expériences pythagori- 
ciennes sur l'instrument de musique dénommé « mono- 
corde », qui ont conduit l’école pythagoricienne à établir 
une correspondance entre les nombres et les sons, 
c'est-à-dire à établir les lois numériques de la musique. 
Sont également connus les concepts de moyenne arith- 
métique et de moyenne géométrique. 

e Le théorème de Pythagore appartient au fonds le 
plus ancien de la mathématique démonstrative, et c'est 
le chef-d'œuvre, précisément, de l'école pythagoricienne 
que d'en avoir donné une démonstration, qu'il est peut- 
être hasardeux d'identifier avec celle d'Euclide (£/éments, 
livre |, propos. 47). Or, pour démontrer que « dans les 
triangles rectangles le carré du côté qui soutient l'angle 
droit est égal au carré des côtés comprenant l'angle 
droit », on se heurte au problème de la duplication du 
carré, et, par là, aux irrationnels. 

e En effet, le cas particulier du triangle rectangle 
isocèle, moitié du carré considéré, et qui donne la solution 
de la duplication, fait découvrir l'incommensurabilité 
de la diagonale du carré à son côté. Sans doute les 
pythagoriciens ont-ils aussi été mis sur la voie par leur 
manipulation de triplets de nombres tels que (3, 4, 5), 

> / m—1m +1 
ou plus généralement tels que (m2), 


avec m impair, qui ont la propriété remarquable de vérifier 
le théorème de Pythagore : le carré du troisième nombre 
est égal à la somme des carrés des deux premiers. C'est 
un des plus beaux événements de la mathématique de 
toujours que le changement d'orientation induit par cette 
découverte : au lieu de calculer une valeur approchée de 
la mesure de la diagonale, on en a démontré l'incommen- 
surabilité par rapport au côté. La démonstration procède, 
selon Aristote, par une réduction à l'absurde, en s'ap- 
puyant essentiellement sur la partition des nombres en 


pairs et impairs. « Ils prouvent, dit Aristote, que le dia- 
mètre du carré est incommensurable au côté, en montrant 
que s'il lui était commensurable, un nombre impair serait 
égal à un nombre pair. » Notons que cette preuve ne se 
trouve que dans les versions tardives du texte d'Euclide 
(livre X, propos. 117), et soulignons aussi que cette 
preuve indirecte, ou apagogique, qui n'est pas l'unique 
façon de démontrer l'irrationalité de la racine carrée de 2 
(mesure de la diagonale du carré de côté 1), constitue 
un type de raisonnement employé pour la première fois 
par les philosophes éléates, Zénon et Parménide. (Sur 
les rapports de la philosophie éléatique et des mathé- 
matiques grecques, voir Mathématiques et philosophie.) 

La géométrie des pythagoriciens est moins riche que 
leur arithmétique: ils ont élaboré un segment de la 
théorie de la similitude, et on leur attribue également le 
théorème sur la somme des angles d'un triangle et cer- 
taines propositions sur les polygones réguliers (livres Il 
et VI d'Euclide). 


Les trois grands problèmes 

L'école pythagoricienne fut suivie par d'autres écoles : 
en particulier celle des sophistes, première école athé- 
nienne, l'Académie de Platon (Ve siècle avant J.-C.) et 
celle d'Eudoxe. 

Au Ve siècle, la mathématique grecque est d'abord 
dominée par ce qu'on a coutume d'appeler les trois 
grands problèmes, dont une solution satisfaisante ne 
pourra être donnée avant le XIX® siècle. 

e Le premier problème est celui de la quadrature du 
cercle. La tradition veut que ce soit Anaxagore de Clazo- 
mènes qui aurait, dans la solitude de sa prison (il avait 
été accusé d'impiété), réfléchi au rapport entre l'aire 
du cercle et celle du carré, inscrit ou circonscrit. Après 
lui, Antiphon le Sophiste considère des polygones inscrits 
dans le cercle, Brison, des polygones inscrits et circons- 
crits, si bien que leur tentative de résoudre le problème 
de la quadrature du cercle aboutit à assimiler le cercle à 
un polygone régulier ayant un nombre infini de côtés : 
c'est la première porte ouverte aux considérations infini- 
tésimales. Mais le problème ne se précise qu'avec les 
grands maîtres : Hippocrate de Chios, Eudoxe et Archi- 
mède. 

e Le deuxième problème est celui de la duplication 
du cube, où l’on demande de construire un cube dont le 
volume est double de celui d'un volume donné, ou plus 
généralement un cube de même volume qu'un parallélé- 
pipède donné. L'oracle de Délos, dit la légende, ayant 
ordonné aux habitants de doubler l'autel du dieu, 
ceux-ci se seraient adressés aux géomètres. Hippocrate 
de Chios, si connu pour son traité sur les lunules, fut le 
premier à s'apercevoir que la solution revenait à trouver 
deux moyennes proportionnelles, en proportion continue 
entre deux lignes droites, dont la plus grande est le double 
de la plus petite, « en sorte que l'embarras fut changé en 
un autre »! Autrement dit, à la recherche d'une grandeur 
inconnue x telle que x3— abc (longueur, largeur et 
hauteur du parallélépipède), Hippocrate substitue la 
recherche de deux grandeurs inconnues x et y telles que : 


a X y 
x y: 


Archytas donne une solution géométrique (dans l'es- 
pace à 3 dimensions) de ce problème et Ménechme, 
disciple d'Eudoxe, le résout par la méthode des inter- 
sections de coniques, en utilisant les paraboles : 


X2 = ay, y? = bx, 


et l'hyperbole xy = ab. 

e La trisection de l'angle constitue le dernier de ces 
problèmes classiques. La trisection, à la règle et au compas, 
de l'angle droit ne fait pas difficulté (Euclide, |, 1) ; celle 
d'un angle obtus, décomposable en un droit et un aigu, 
est possible à condition de savoir faire celle d'un angle 
aigu; et c'est là qu'est le problème. Hippias d'Élis en 
donna une solution, en inventant la quadratrice, qui est 
une courbe transcendante, non constructible à la règle 
et au compas (fig. 10). 

Soit le carré ABCD, de côté a, BD l'arc de cercle de 
rayon a. Si AD, animé d'un mouvement uniforme autour 


Te 
de À, balaie l'angle droit DAB, alors que DC, en restant 
parallèle à sa direction, se déplace uniformément vers AB, 
une courbe DO est engendrée, dont le point M est tel que : 
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Snark International 


À Euclide présentant x 
ses Éléments à Ptolémée 1°", cotg 9 = —. 
d'après une gravure # 
du XIX® siècle. y 7 o1 Vi ; 
Comme = = 0) — = —, Si bien qu'à la division de 
a 2 o2  ÿ2 


l'ordonnée y — PM en n parties égales correspond celle 
de l'angle © en autant de parties égales. [L'équation de 


cette transcendante est x — y * cotg —. 


Outre ces fameux problèmes, les Grecs ont créé l'étude 
des sections coniques. Ménechme les avait utilisées pour 
le problème de Délos ; mais c'est Éristée (350 avant J.-C.) 
qui sut engendrer l'ellipse, l'hyperbole et la parabole, et‘qui 
a inspiré directement Euclide. Apollonios de Perga (fin 
du IIIe siècle) a introduit les termes d'hyperbole, de 
parabole, et d'ellipse, tandis qu'Aristée et Archimède 
parlent de section du cône à angle aigu (ellipse), section 
du cône à angle droit (parabole), et section du cône à 
angle obtus (hyperbole). Aristée a écrit un ouvrage sur 
les coniques dont Pappus nous a gardé la mémoire, tandis 
qu'un traité d'Euclide sur le même sujet est perdu; mais 
les travaux d'Archimède et d’Apollonios (8 livres sur les 
Coniques) généralisent et systématisent les résultats 
de leurs prédécesseurs; en particulier, le 5° livre des 
Coniques est, avec le livre V des Éléments d'Euclide, la 
lettre sur la Méthode et le traité Des spirales d'Archimède, 
un des principaux chefs-d'œuvre de la géométrie grecque. 

Cependant, avec ces grands noms, nous abordons la 
période hellénistique. 
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La mathématique hellénistique 

On n'aurait pu mesurer à sa juste valeur tout le travail 
qui s'est accompli durant cette première période dont 
nous venons de parler, s'il n'avait abouti à ce monument 
euclidien qui résume aussi bien l'œuvre technique de 
découverte que l'œuvre méthodique d‘enchaînement et 
de démonstration entreprises de Thalès à Eudoxe. 

e Euclide 

On sait peu de chose sur sa vie qui se situerait à Alexan- 
drie de 365 à 300 avant J.-C. Le néo-platonicien Proclus, 
qui a écrit un important commentaire des Éléments, nous 
rapporte qu'Euclide avait répondu à Ptolémée ler, qui lui 
avait demandé s'il n'y avait pas vers la géométrie de route 
plus courte que celle des Éléments : « 11 n'y a pas de voie 
royale en géométrie. » Proclus nous assure aussi qu'Eu- 
clide avait ordonné et rendu cohérente une matière mathé- 
matique prête depuis Eudoxe, en complétant, entre autres, 
les trouvailles de Théétète et en donnant des preuves 
inattaquables pour nombre de propositions sans rigueur 
avant lui. 

Les Éléments achèvent donc le travail fondateur des 
premiers mathématiciens grecs, dont les noms ne sont 
jamais rappelés dans cet édifice à caractère plus théorique 
qu'historique, au style rigoureusement démonstratif, à la 
portée essentiellement méthodique, à l'ambition fonda- 
trice. Toutefois, sous l'habillage logique transparaît la 
variété de l'inspiration : les Éléments véhiculent, en effet, 
des traces de l'ancien pythagorisme et trahissent les états 
des discussions sur les concepts des mathématiques, 
et sans doute aussi sur l’idée de démonstration. 

Les premiers livres (1, 11, III et IV), d'inspiration pytha- 
goricienne, traitent de la géométrie du plan. Le premier, 
qui étudie les triangles, les droites parallèles, les aires des 
parallélogrammes et des triangles, contient la démons- 
tration du fameux théorème de Pythagore (propos. 47 et 
48); les trois autres contiennent respectivement des 
énoncés d'arithmétique algébrique appliqués à des figures 
géométriques, la géométrie du cercle et l'étude des poly- 
gones à 3, 4,5, 6 et 15 côtés. 

La notion de similitude n'apparaît qu'au livre V, qui 
traite de la théorie des proportions. || s'agit alors d'une 
mathématique issue de la réforme d'Eudoxe, et donc 
décalée d'environ deux siècles par rapport à celle des 
quatre premiers livres. La fameuse définition 5 de ce 
livre V signifie qu'après les entiers (ép@uot) et les 
fractions (A6yo:) les _irrationnels acquièrent droit de 
cité numérique sous forme de grandeurs (uéyetoi). 
Voici, retranscrite en langage moderne, cette définition : 


a. GC": ' us 
5 si et seulement si pour tout couple (m, n) d'entiers 


quelconques 


ma > nb => mc> nd 
ma = nb — mc= nd 
ma < nb — mc < nd 


Il faut aussi mentionner que la définition 4 énonce 
l'axiome d'Eudoxe, plus connu sous le nom d'axiome 
d’Archimède, qui postule que deux grandeurs sont tou- 
jours comparables. Ce livre V, dont le contenu n'a été 
vraiment assimilé dans toute sa généralité et dépassé que 
depuis un siècle à peine, restera un des sommets de la 
pensée mathématique de tous les temps. 

Le livre VI est important mais plus élémentaire; c'est 
une application du livre V à des problèmes géométriques ; 
il contient notamment le théorème de similitude, impro- 
prement appelé théorème de Thalès. 

Avec le livre VII, commence la 3° partie des Éléments, 
la partie arithmétique qui se prolonge jusqu'au livre X 
et constitue le premier traité, le plus rigoureux jusqu'à 
Gauss, de théorie des nombres. Le livre VII applique la 
théorie des proportions aux nombres entiers, et utilise, 
pour la première fois, le procédé. appelé « algorithme 
d'Euclide » pour trouver la plus grande commune mesure 
de deux nombres. S'y trouvent aussi des propositions sur 
les nombres premiers entre eux et sur le plus petit commun 
multiple de deux nombres. 

Le livre VIII établit une théorie des puissances entières 
des fractions. 

Le livre IX contient, à côté de propositions sur le pair 
et l'impair, le théorème remarquable qui établit qu'il y a 
une infinité de nombres premiers. 

Le livre X, célèbre, est consacré à la théorie des irra- 
tionnels; c'est partiellement un héritage de Théétète et 
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d'Eudoxe, et qui les dépasse pour ce qui est de la minutie 
et de la rigueur. La première proposition fonde la méthode 
d'exhaustion, puis, après quelques applications de l'algo- 
rithme d'Euclide, est exposée une théorie des expressions 


de la forme VE + Vb. Cette proposition a un rapport 
étroit à l'axiome de mesurabilité (ou axiome d'Archimède). 
La voici dans sa formulation euclidienne : « Deux gran- 
deurs inégales étant données, si on retranche de la plus 
grande une partie plus grande que sa moitié, si l'on retran- 
che du reste une partie plus grande que sa moitié, et si 
l'on fait toujours la même chose, il restera une certaine 
grandeur, qui sera plus petite que la plus petite des 
grandeurs proposées. » C'est-à-dire en langage moderne : 
pour 2 réels a et b tels que a > b > O et pour une suite 


; 1 RE 
&,.i= 1,2,..,n et & < 5 pour tout /, il existe K tel que : 


a°&°…" ax < b. 


Les trois derniers livres sont consacrés à la stéréo- 
métrie, ou géométrie de l’espace; on y trouve les défini- 
tions du cône, de la sphère, du cylindre, données cinéma- 
tiquement, alors que les livres de géométrie plane excluaient 
tout recours au mouvement. On y trouve encore l'étude, 
par des procédés infinitésimaux, qui, selon Archimède, 
remontent à Eudoxe, des aires de cercles, des volumes 
de pyramides, cônes, cylindres ou sphères. La technique 
de démonstration est la méthode d'exhaustion. Enfin, le 
dernier livre traite des cinq polyèdres réguliers (fig. 11). 

Avec les Éléments apparaît la méthode axiomatique. 
Celle-ci, longtemps attribuée à l'influence de la théorie 
aristotélicienne de la démonstration (Analytiques 11), sem- 
ble plutôt répondre à la nécessité de « fermer » le discours 
mathématique, par des stipulations qui, soit répondent aux 
défis des dialecticiens, soit limitent l'investigation aux 
seuls domaines maîtrisés et où les êtres mathématiques 
aient un sens précis. Ainsi l’axiome : « Le tout est plus 
grand que la partie », aurait pour fonction d'exclure les 
spéculations dialectiques sur l'infini dans la mesure ou le 
nombre, tandis que le fameux axiome géométrique dit des 
parallèles permet la considération (abstraite) d'un espace 
infini. 

e Archimède de Syracuse 

L'œuvre de ce mathématicien, tué en 212 par un soldat 
romain, lors du sac de Syracuse, se distingue, dans la 
mathématique ancienne, par les considérations qui la 
rapprochent du calcul infinitésimal des modernes. Voici, 
dans l'ordre chronologique, la liste des ouvrages d'Archi- 
mède qui nous sont parvenus : 

— De l'équilibre des plans (premier livre). 
La Quadrature de la parabole. 
De l'équilibre des plans (second livre). 
De /a sphère et du cylindre (deux livres). 
Des spirales. 
Sur les conoïdes et les sphéroides. 
— Sur les corps flottants (deux livres). 
— La Mesure du cercle. 
L'Arénaire. : 
De la méthode (lettre à Ératosthène découverte 
au début de ce siècle). 

Deux traits principaux caractérisent le génie d'Archi- 
mède : son attention à la technique dont il sait tirer un 
parti théorique (la statique, par exemple, lui inspire certai- 
nes découvertes géométriques), et sa conception du 
continu comme somme d'une infinité d'indivisibles 
une aire est une somme de segments rectilignes très petits, 
un volume une somme de sections planes. 

Dans /a Quadrature de la parabole, il montre ainsi que le 
segment de parabole, encadré par deux séries de trapèzes 


respectivement inscrits et circonscrits, n'est ni supérieur 
ni inférieur aux 4/3 du triangle ABC, et donc leur est 
égal (fig. 12). 

Dans De /a sphère et du cylindre, il établit que la surface 
latérale d'un cône ou d’un cylindre droit doit être supé- 
rieure à celle d'une pyramide ou d'un prisme circonscrit, 
et s'attaque (dans le livre 11) à des problèmes comme de 
trouver une sphère de même volume qu'un cône ou qu'un 
cylindre donné. Il y parvient en ramenant la question à 
l'insertion de deux moyennes proportionnelles entre 
deux longueurs données, méthode sans doute courante 
à l'époque, quoiqu'elle ne s'inscrive pas dans le cadre 
des constructions possibles à la règle et au compas. 

Il faut souligner qu'Archimède fait précéder ses résul- 
tats de l'énoncé d'axiomes, dont le célèbre postulat 
d'Archimède où axiome de mesurabilité et la définition 
de la droite comme le plus court chemin entre deux points. 

L'axiome de mesurabilité, qui pose que, pour deux 
grandeurs quelconques a et b, il existe un entier positif » 
tel que, multipliée par ce nombre, la plus petite des gran- 
deurs dépasse la plus grande, est utilisé dans le Traité 
des conoides et sphéroïdes, où apparaissent trois nou- 
veaux corps de révolution : sphéroïde engendré par la 
rotation d'une ellipse autour d'un de ses axes, conoïde 
obtusangle engendré par la rotation d'une branche de 
l'hyperbole autour de son axe transversal et conoïde 
rectangle engendré par la rotation d'une parabole autour 
de son axe. C'est dans cet ouvrage que l'application de la 
méthode d’exhaustion semble le plus proche du concept 
d'intégrale définie qui demeure implicite dans la variété 
des problèmes géométriques résolus. 

Le traité Des spirales, qui est l'étude d'une courbe définie 
cinématiquement, la spirale d'Archimède, contient une 
méthode remarquable pour la détermination de la tan- 
gente en un point à la courbe, qui en fait le plus ancien 
traité de calcul différentiel. 

Dans /a Mesure du cercle, on trouve la première approxi- 
mation de 7 par un encadrement entre des bornes ration- 
nelles : 

10 10 
. — = En 
3 7 <T<$ 70 = 914. 

Enfin, dans /’Arénaire, se trouve un système de numé- 
ration qui permet l'expression des très grands nombres, 
par exemple l'unité suivie de 800 millions de zéros, illustrée 
par le calcul d'un nombre supérieur à celui des grains de 
sable contenus dans la sphère des fixes. 

e Apollonios de Perga 

Apollonios (fin du IIIe siècle-début du 11°) est surtout 
connu par son fameux traité sur les Coniques (dont il a 
déjà été question ici), partiellement conservé en grec 
et partiellement en arabe. D'autres travaux, fort nombreux, 
ne nous sont connus que par le commentaire de Pappus. 
Apollonios a systématisé et unifié l'étude des coniques, 
considérées comme sections d’un cône de révolution 
par un plan perpendiculaire à une de ses génératrices. 
Le livre V est un des principaux chefs-d'œuvre de la 
mathématique ancienne; on y construit la normale en un 
point à une courbe, non pas comme perpendiculaire à la 
tangente en ce point, mais indépendamment d'elle, comme 
la distance la plus courte d’un point donné à la courbe. 
Il y a là un style d'inspiration si profonde que, pour la 
dépasser, il n’a pas suffi, comme on le croit trop souvent, 
de la géométrie cartésienne ; il y a fallu encore les notions, 
plus tardives, de transformation et d'éléments idéaux. 

e Diophante 

Au début du Ile siècle de l'ère chrétienne, les préoccupa- 
tions calculatoires connurent un nouvel essor avec Nico- 
maque de Gérase (vers l'an 100), le très élémentaire 
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la géométrie d'Euclide 
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Théon de Smyrne, et surtout le grand Diophante (milieu 
du IIIe siècle), dont les Arithmétiques viennent tout juste 
de s'enrichir d'un manuscrit arabe contenant certains 
livres qu'on croyait perdus. On ne dispose pas à ce jour 
d'une édition scientifique de son œuvre connue. On dit 
que celle-ci résulte de la renaissance pythagoricienne du 
11e siècle, et on y voit aussi la continuation de la tradition 
des logisticiens pour qui le mot « nombre » avait un sens 
large, englobant l’inconnue des problèmes algébriques 
dont la solution peut être entière, fractionnaire, voire 
même irrationnelle. Mais, ce faisant, on suppose sur l'his- 
toire de l'algèbre bien des choses qui sont loin d'être 
établies. 

Il n'y a pas de doute, néanmoins, que Diophante résout 
des problèmes « indéterminés » du type : x3 + y3 = x + y. 
Bien que l'on appelle aujourd'hui équations diophan- 
tiennes des équations aux solutions entières : ax + by = c, 
on ne trouve chez lui que des équations de la forme : 
Xx2— ay? — 1 (appelées équations de Pell). La méthode 
de Diophante consiste à chercher des solutions parti- 
culières, en usant d'artifices qui n'ont jamais le caractère 
général des vraies méthodes algébriques, et qui souffrent 
du manque patent d'une notation adéquate, ce qui n'avait 
pas empêché leur auteur de s'attaquer à des problèmes 
vraiment difficiles. 

e Pappus 

Après Diophante, c'est Pappus (vers 320 de l'ère chré- 
tienne) qui achève la période vraiment créatrice de la 
mathématique hellénistique, et grecque en général. On 
trouve notamment dans la Collection mathématique une 
généralisation du théorème de Pythagore, les théorèmes 
dits aujourd'hui de Guldin sur la relation entre les centres 
de gravité et les aires où les volumes des corps de révo- 
lution, et le théorème dit de Pappus-Pascal. Puis vient 
la période des commentateurs : Proclus, qui a commenté 
Euclide, Eutocius, qui a commenté Archimède et Apol- 
lonios. 


Conclusion 


Quand on veut caractériser globalement la mathéma- 
tique grecque, on dit que l'essentiel en est l'usage d'un 
raisonnement hypothético-déductif et des démonstra- 
tions. C'est dire qu'elle a inauguré une démarche qui, après 
avoir accepté un point de départ plus ou moins justifié, 
parcourt par ordre une série d'étapes, dont chacune doit 
être, de manière vérifiable, compatible avec le point de 
départ, et où tout nouvel apport de l'intuition est exclu. 
Méthode maintes et maintes fois évoquée dans les Dja- 
logues de Platon, mais rarement de façon aussi précise que 
dans ce passage du Phédon, où Socrate nous dit que sa 
découverte essentielle consiste dans l'extension de cette 
méthode selon laquelle « après avoir dans chaque cas 
pris pour base une notion, celle qu'éventuellement je juge 
la plus forte, tout ce qui, selon moi, a consonance avec 
elle, je le pose comme étant vrai. tandis que si la conso- 
nance fait défaut, je pose que ce n'est point vrai» (Phédon, 
100 b). 

On a reproché pourtant à cette mathématique d'avoir 
insuffisamment élucidé les notions primitives, de ligne 
droite, par exemple, de surface, de rapports de grandeurs. 
Et on y a vu aussi une étude qualitative de la quantité, 
par opposition à l'esprit de la science classique, qui est une 
étude quantitative de la qualité. 


La mathématique médiévale 


La mathématique arabe 


La civilisation brillante qui se développe, à la fin du 
VIIIe siècle et au début du IX®, sous l'impulsion unifiante 
de l'Islam, a fondu ensemble des courants de culture de 
toute origine, et d'abord des traditions mathématiques 
divergentes dont on n'aurait point auparavant imaginé la 
rencontre possible. Non seulement on rassemble avec 
enthousiasme l'héritage de l'Hellade, mais encore on 
l'enrichit du contenu de textes mathématiques néo-persans 
ou sanscrits. Une nuée de traducteurs donne en version 
arabe Euclide, Archimède, Ménélaus, Pappus, Ptolémée, 
si bien que l'on dispose souvent aujourd'hui de manus- 
crits arabes plus anciens que les textes grecs retrouvés, et 
que, si ceux-ci semblent irrémédiablement perdus, c'est 
aux traductions arabes que l’on s'adresse pour compléter 
ce que l'on sait de la mathématique grecque. 
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Certes, bien des problèmes posés par ces faits sont 
de nature plutôt philologique. L'histoire des mathéma- 
tiques arabes se réduirait à des questions de philologie 
si elle n'était que l’histoire de la transmission du savoir 
grec. Or, l'œuvre d'AI-Khawarizmi, par exemple, est si ori- 
ginale que les sources indiennes et grecques ne peuvent 
expliquer la nouveauté d'un horizon dont elles ne forment 
que des éléments, repensés et, pour ainsi dire, recréés. 

Il est cependant trop tôt pour présenter un exposé de 
la mathématique arabe, dont l'étude se limite encore, la 
plupart du temps, à établir des listes de noms et de titres 
et à exploiter l'ample matière léguée par les polygraphes. 
Nous ne disposons pas encore d'une synthèse valable. 
Celle d'A. P. Juskewitsch (Geschichte der Mathematik 
im Mittelalter ou Histoire de la mathématique au Moyen 
Age, Leipzig, 1964) reste la meilleure, bien que les détails 
en soient souvent à revoir. Nous centrerons nos indications 
uniquement sur les points suivants : 

— le commencement de l'algèbre; 
— les généralisations ; 
— la naissance de la géométrie algébrique. 


Le commencement de l'algèbre 

Les débuts de la mathématique arabe sont liés au nom 
de Mohammed Ibn Moussa Al-Khawärizmi dont le 
manuel d'arithmétique (de 830 environ) nous est connu 
par une traduction latine du XIIe siècle. C'est le premier 
manuel clairement fondé sur le principe de position. Il 
débute par une description du système de numération dite 
indienne, au moyen des symboles : 1, 2, 3, 4, 5, 6, … 9, 
et du « petit cercle » qui sert à noter le zéro. Suit l'exposition 
des opérations arithmétiques sur les nombres entiers. 
Notons, sans entrer dans les détails, que ce manuel a 
joué un très grand rôle dans le développement de l'arith- 
métique. 

Mais Al-Khawarizmi est surtout l'auteur du premier 
traité d'A/gèbre. Immortalisé une première fois par son 
nom même qui, défiguré, sert à désigner un des concepts 
les plus anciens et les plus actuels de la mathématique : 
le concept d’ « algorithme », il l'a été aussi une deuxième 
fois par le titre de son second ouvrage : A/-jabr wal 
mugabala, ce qui signifie « disposition et contraposition » 
en entendant par le premier mot le fait qu'une équation 
ne contient que des termes positifs et par le second le 
fait de soustraire des quantités égales de chaque côté du 
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signe =. La dénomination « algèbre » apparaît donc dans 
le titre et semble avoir été choisie pour désigner la branche 
des mathématiques où l’on calcule avec des lettres. 
L'ouvrage a exercé une grande influence sur les mathé- 
maticiens du Moyen Age. Malgré l'absence d'un symbo- 
lisme adéquat dont la fonction est remplie par les mots 
de la langue, AI-Khawarizmi atteint ici un degré de systé- 
matisation sans précédent; toute équation du premier 
ou du second degré estramenée à l'un des 6 types suivants: 


1) ax2 = bx 
2) ax?= c 
8) bx=0c 


La réduction à ces formes canoniques se faisait par 
l'opération al-jabr qui consiste à transporter dans l'un 
des membres de l'équation, sous forme de termes à 
additionner, les termes qui sont à soustraire dans l'autre 
membre, et par l'opération al-mudgabala qui consiste à 
retrancher aux deux membres les termes égaux. AI-Khawa- 
rizmi indique les conditions d'existence des racines : 
les règles sont énoncées sur des exemples mais sous une 
forme générale; certaines sont démontrées à l'aide de 
transformations géométriques. Cependant, il n’est ques- 
tion que des racines positives. L'ensemble tend vers la 
constitution d'un véritable calcul algébrique. 

L'algèbre des équations du second degré fut, ensuite, 
développée par Abu Kamil. Le traité de celui-ci ne contient 
déjà plus les applications géométriques que l'on trouvait 
dans celui d'AÏ-Khawarizmi. Mais le moment le plus 
important est celui où cette algèbre devient un objet 
mathématique propre, c'est-à-dire celui où les démons- 
trations ne recourent plus aux constructions géométriques ; 
c'est alors que se dessine un second mouvement dans 
l'histoire de l'algèbre arabe : une arithmétisation permet- 
tant d'opérer sur les inconnues par tous les moyens de 
l'arithmétique opérant sur les connues, selon le vœu de 
l'algébriste marocain As-Samaw' al. 


4) ax? bx= 0e 
5) ax2?+ c= bx 
6) bx + c = ax? 


Les généralisations 

Cette généralisation est, en fait, précédée par l'œuvre 
du fameux Omar Khayyäm, chez lequel l'idée de l'algèbre 
comme discipline autonome devient particulièrement 
manifeste. « L'algèbre, écrivait-il dans son ouvrage (1074), 
est un art scientifique. Son objet est : le nombre absolu 
et les grandeurs mesurables, étant inconnus, mais rapportés 


à quelque chose de connu de manière à pouvoir être déter- 
minés ; cette chose connue est une quantité où un rapport 
individuellement déterminé, ainsi qu’on le reconnaît en 
l'examinant attentivement; ce qu'on cherche dans cet 
art, ce sont les relations qui joignent les données des pro- 
blèmes à l'inconnue, qui de la manière susdite forme 
l'objet de l'algèbre. » Un objet concu, comme on le voit, 
sans recours ni à la géométrie ni à l’arithmétique ; l'algèbre 
apparait désormais comme une théorie des équations. 

C'est pourquoi l'essentiel du travail d'Omar Khayyam 
consiste dans une classification des équations. Comme on 
doit distinguer des grandeurs numériques et des grandeurs 
continues, l'algèbre exige une solution numérique et une 
construction géométrique correspondant à l'équation. 
Khayyam montre ainsi qu'il y a une relation entre la solu- 
tion par radicaux des équations du deuxième degré et la 
construction géométrique ; cela le conduit à s'apercevoir 
que la solution par radicaux des équations cubiques ne 
peut être trouvée, lacune qu’ «un autre qui nous succédera 
comblera »! Il expose alors la théorie géométrique des 
équations du troisième degré, puis dénombre 19 types 
d'équations canoniques à racines positives : 5 se réduisent 
à des équations quadratiques ou linéaires, 6 sont des 
trinômes, 7 des quadrinômes, et une correspond à l'équa- 
tion binomiale xè — a. |l explique, en outre (pour la pre- 
mière fois, notent Juskewitsch et Rosenfeld), que les 
équations du troisième degré ne peuvent pas être résolues 
à l’aide des « propriétés du cercle », c'est-à-dire par des 
radicaux quadratiques. Dans ce domaine, la preuve, nous 
dit Khayyam, ne peut être fournie que par les propriétés 
des sections coniques. Descartes le répétera en 1637, 
et en 1837 c'est Wantzel qui le montrera. 

L'extension du calcul algébrique, qui fut l'œuvre d'Al- 
Karaji et d'As-Samaw'al, donna enfin à la science algé- 
brique toute sa spécificité. La théorie des équations se 
constitua par l'application progressive des différentes 
opérations de l’arithmétique aux termes et expressions 
algébriques. C'est ce que montre l'édition par M. M. Salah 
Ahmed et Roshdi Rashed (Damas, 1972) d'un manuscrit 
intitulé A/-Bahir en algèbre, dû à As-Samaw’ al; il en 
ressort que : 

— Les algébristes arabes ont parfaitement défini 
les exposants négatifs et nuls, avant Chuquet et Stifel, 
et ont donc fait la première étude systématique des expo- 
sants algébriques. As-Samaw’ al va plus loin que ses 
prédécesseurs, car il définit par induction x? = x? 1 x, 
pour n = 1,2, 3, ….; il étend la notion de puissance algé- 
brique d'une quantité à son inverse, énonce la règle de 
multiplication et de division des puissances algébriques 
dans sa généralité, dégage explicitement l'idée d'addition 
algébrique des puissances, en exploitant, par la méthode 
des tableaux, l'isomorphisme de groupes entre (Z, +) et 
(£xh; x EZ}, x). 

— C'est sur cette base que peut s’édifier une théorie 
générale de la divisibilité des expressions algébriques, 
de l’approximation des fractions entières, de l'extraction 
de la racine des polynômes à coefficients rationnels, et de 
l'extension du calcul algébrique aux quantités irration- 
nelles algébriques. La question de savoir comment 
utiliser les instruments arithmétiques dans les quantités 
irrationnelles s'est même posée explicitement. 


Naissance de la géométrie algébrique 

Les problèmes posés par les équations du troisième et 
du quatrième degré ont sans doute orienté l'intérêt vers 
une géométrie algébrique. Les Arabes ont ainsi retrouvé 
la solution d'Archimède du problème que constitue la 
détermination de l'intersection d'une sphère par un plan, 
de sorte que le rapport des volumes des deux segments 
sphériques obtenus égale un rapport préalablement donné. 
On cite généralement Al-Mahani pour avoir ramené ce 
problème à la résolution d'une équation du type : 

x3 = 2 — px?, 
et Ibn Al-Haytham pour l'avoir résolu par une construc- 
tion géométrique représentant la grandeur x par l'abscisse 
du point d‘intersection de deux sections coniques conve- 
nablement choisies. 

C'est dans un traité réservé à la théorie des équations que 
Saraf-ed-Din At-Tüsi, persévérant dans cette voie, 
ébauche une géométrie algébrique par l'usage d'une 
méthode qui s'apparente à celle de Viète. At-Tusi applique 


sa méthode des tableaux à la solution de l'équation 
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<« Page extraite 

d'une traduction latine 

du XIIe siècle du Traité 
d’algèbre d’AI-Khawärizmi 
(Bibliothèque nationale, 
Vienne). 
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d'un manuscrit de géométrie 
arabe datant du XIIIe siècle 
(Bibliothèque universelle, 
Istanbul). 

A droite, 

page d'un livre de Boèce 
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x2+ ax = N (avec a€Z), et l'étend aux équations 
cubiques. L'exemple de la solution de l'équation 
X3— a1X — a2x — c — O montre qu'en fait cette méthode 
s'applique à une fonction polynôme à coefficients ration- 
nels (dans Z), et, par ailleurs, qu'elle véhicule implici- 
tement la notion importante de dérivée. At-Tusi, en effet, 
utilise systématiquement pour diviseurs des expressions 
qui correspondent algébriquement à la dérivée première; 
dès lors, la détermination de la racine entière positive 
d'une équation numérique par une méthode d'approxi- 
mation véhicule aussi la notion de fonction. Du reste, 
dans la discussion de l'existence des racines des équations 
algébriques, la notion de dérivée apparaît nettement; 
At- Tusi, en classant les équations, isole celles qui n'ont 
de racines que sous certaines conditions ; pour les résou- 
dre, il est conduit à étudier la valeur maximale des expres- 
sions algébriques, à prendre leur dérivée première, à 
l'annuler, puis à montrer que la racine de l'équation 
obtenue, substituée dans l'expression algébrique, donne 
le maximum cherché. Tout cela le met sur la voie des 
notions de « limite », de borne supérieure et borne infé- 
rieure des racines d'une équation, et, par suite, sur la voie 
d'une étude algébrique des courbes, de la découverte de 
la formule de Cardan, de la corrélation entre transforma- 
tion affine, divisibilité et dérivée dans la solution d'une 
équation. D'où l'usage des équations des courbes dans 
la démonstration, par exemple, de l'intersection de la 
parabole et de l'hyperbole. 

Ainsi, c'est chez les Arabes que l'arithmétique et 
l'algèbre se sont émancipées de la tutelle géométrique. 
Et c'est dans le cadre de cette émancipation qu'est née 
une algébrisation de la géométrie, c'est-à-dire une pré- 
figuration de la géométrie algébrique. On peut aussi 
bien ajouter que la trigonométrie ne s'est développée 
comme discipline autonome qu'entre les mains des 
Arabes : c'est Al-Khawaärizmi qui donne les premières 
tables de sinus, qui furent traduites en latin dès 1126, 
et le traité de At-Tusi (7raité du quadrilatère complet, 
1260) a exercé une influence considérable sur le dévelop- 
pement de la trigonométrie. 

Parmi bien d'autres prouesses de calcul sur lesquelles 
nous ne pouvons nous arrêter ici, nous ne retiendrons 
qu'une remarquable approximation de 

r = 3,141 592 653 589 793 25, 


un calcul original de la quadrature du segment de para- 


bole, équivalent au calcul de l'intégrale Vx dx, le 


calcul du volume de certains nouveaux corps de révolu- 
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tion obtenus par la rotation du segment de parabole 
limité par une corde et par le diamètre conjugué, autour 


n 


de cette dernière droite, équivalent à l'intégration 


ra 
x dx. 


V 


L'Occident médiéval 


On ne trouvera rien d'aussi vivant dans la mathématique 
de l'Occident médiéval. Ou plutôt presque rien avant la 
constitution de la scolastique, c'est-à-dire avant la fonda- 
tion des universités de Paris, de Bologne et d'Oxford. 
Dans le Haut Moyen Age, rares sont ceux qui, comme 
Boethius, se préoccupent de sauver et transmettre l’héri- 
tage ancien. La recrudescence de l'anarchie limite le déve- 
loppement scientifique, mais favorise l'application non 
scientifique des nombres aux textes sacrés, l'assimilation 
des distances entre les astres à une gamme musicale. 

Il faut attendre les premiers contacts avec l'Islam pour 
retrouver des faits dignes d'attention. Gerbert (945-1003), 
archevêque de Reims, de Ravenne et pape en 999, sous 
le nom de Sylvestre II, a séjourné en Espagne de 967 à 969; 
c'est lui qui a diffusé en Europe les chiffres arabes, et il 
fut le premier, au témoignage de Guillaume de Mal- 
mesbury, à prendre l'abaque aux Sarrasins. De fait, le 
développement du commerce ne cesse de poser des pro- 
blèmes, de la tenue des livres au calcul des monnaies, si 
bien que l'abaque lui-même cède bientôt la place à 
l'a/gorisme et que des simplifications des procédés de 
calcul se développent jusqu'à livrer l'outillage intellectuel 
qui permettra la révolution de pensée qui caractérise la 
science classique. 

Après la prise de Tolède (1085) commence une nouvelle 
circulation du savoir sur le pourtour de la Méditerranée. 
Puis, au XIIe siècle, se développe le mouvement des tra- 
ductions de textes arabes. Un moine, Walcher de Malvern, 
se fait enseigner comment les Arabes calculent le cours du 
Soleil et de la Lune, et conçoit, dans sa fameuse Disciplina 
claricalis, une nouvelle classification des branches du 
savoir qui favorise les sciences exactes, avec, aux pre- 
mières places, la logique, l'arithmétique, la géométrie et 
la médecine, sans négliger, cependant, la musique, 
l'astronomie et, en dernier lieu, la philosophie ou gram- 
maire. 

D'un autre côté, Léonard de Pise (Leonardo Fibonacci, 
mort vers 1250) s'est initié directement, par des séjours 
en Afrique du Nord et au Moyen-Orient, aux pratiques du 
calcul. À son retour à Pise, il compose le célèbre Liber 
abaci (1202), qui familiarise l'Europe avec les chiffres 
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arabes: dans ses calculs, il utilise le zéro et la suite dite 
de Fibonacci. Cet ouvrage, remanié et réédité en 1228, 
contient des connaissances mathématiques précieuses qui 
font de Léonard l'ancêtre de l’école algébrique italienne. 

Plus tard, les préoccupations scientifiques gagnent le 
nord de l'Europe. A Paris, dès avant Nicolas Oresme 
(t 1382), Johannes Campanus et Jordanus Nemorarius 
étudient la mathématique antique; à Oxford, Thomas 
Bradwardine (t 1349) s'intéresse à des notions infini- 
tésimales dans son De continuo, qui rappelle les grandes 
discussions de Zénon et d'Aristote sur l'infini. Le trait le 
plus original se trouve certainement dans l'ouvrage 
d'Oresme, appelé 7ractatus de latitudinibus formarum, 
qui présente le premier système de coordonnées, en 
montrant la nécessité d‘exprimer les nombreuses varia- 
tions des phénomènes par le recours au concept de figure 
géométrique. On se trouve sur la voie d'une description 
graphique des phénomènes naturels, donc d'une mathé- 
matisation de la physique. C'est le commencement d'un 
essor intellectuel dont l'ampleur apparaîtra dans la période 
suivante, période décisive qui est celle de la Renaissance 
et de la mathématique classique. 


La Renaissance et la préparation 
de la mathématique classique 


On insiste souvent sur le caractère révolutionnaire de 
l'orientation scientifique du XVII® siècle, et le fait est qu'est 
en jeu une transformation intellectuelle qui rend la mathé- 
matique organiquement liée au souci d'agir efficacement 
sur le monde, de suivre et d'informer l'expérience, de la 
géométriser. Il ne faudrait cependant pas oublier que la 
science classique est l'aboutissement d'efforts propres à 
la Renaissance, laquelle prolongeait le mouvement d'ap- 
propriation du savoir arabe et grec commencé au Moyen 
Age. 

Au réveil des études mathématiques semble présider 
Nicolas de Cues (1401-1463), qui naquit sur les bords de 
la Moselle et fut une sommité intellectuelle de son temps. 
Ses ouvrages strictement mathématiques n'ont pas fait 
époque, tandis que ses considérations métamathématiques 
sur la notion d'infini et sur l’idée que seules les mathé- 
matiques permettent à l'homme de comprendre l'Univers 
semblent avoir eu une grande influence sur des penseurs 
aussi importants que Léonard de Vinci, Giordano Bruno, 
Copernic et Kepler. 

Pour noter quelques aspects de l'essor préparatoire 
de la Renaissance, il convient d'évoquer l'œuvre de Georg 
Peurbach (1423-1461), dont l'effort consista essentiel- 
lement dans l'assimilation de l'héritage gréco-arabe, dans 
la diffusion du calcul, et surtout dans la rationalisation de 
l'astronomie. Profitant des travaux arabes, surtout ceux 
d'Arzachel, il a écrit l'un des premiers traités de trigono- 
métrie européens, accompagné d'une table des sinus d'une 
grande précision pour l'époque. 

Regiomontanus (1436-1476), son brillant disciple, 
Johannes Müller de son vrai nom, a travaillé directement 
sur les écrits de Ptolémée, a édité et commenté des textes 
scientifiques grecs; son œuvre personnelle est contenue 
dans le De triangulis omnimodis libri quinque (imprimé 
seulement en 1533) où, à la suite de Nasir ad Din At-Tusi, 
il veut constituer la trigonométrie comme science auto- 


nome, tout à fait indépendante de l'astronomie. A. Koyré 
a souligné que Regiomontanus connaissait très bien ses 
prédécesseurs juifs et arabes auxquels il emprunte beau- 
coup de ce que l'on lui a attribué, mais son œuvre eut, 
en tant que somme systématique, une influence méritée. 
Les deux premiers livres du De triangulis sont consacrés 
à la trigonométrie plane, les autres à la trigonométrie 
sphérique; on y trouve le théorème fondamental, déjà 
connu de Levi-ben Gerson, sur la proportionnalité des côtés 
du triangle aux sinus des angles correspondants. 

L'œuvre de Luca Pacioli, la Summea de arithmetica, geo- 
metria, proportioni et proportionalita (1494), moins origi- 
nale que le 7riparty de Chuquet (1484), a cependant ce 
caractère de synthèse à la fois méthodique et savante qui 
lui assure une large diffusion et en fait une transition vers 
le XVIe siècle : elle contient un système d'appellations qui 
préfigure l'effort de codification du langage mathématique 
et emploie des signes pour noter certaines opérations 
(p et m pour + et—, par exemple). 

Léonard de Vinci (1452-1519), ami de Pacioli, et, en 
Allemagne, Albrecht Dürer (1471-1528), sont de ces 
génies, artistes et amateurs de géométrie, sachant jeter 
un pont entre la théorie pure et les techniciens, artisans, 
peintres, architectes, dans le but, en définitive, d'intégrer 
l'art lui-même à la science. Léonard de Vinci, formé dans 
l'atelier de Verrocchio, atelier de peinture en même temps 
qu'école de tous arts et métiers, s'intéresse à une géomé- 
trie dont il aperçoit la continuité avec la mécanique. D'où 
la force de son intuition qui lui fait découvrir le centre de 
gravité de la pyramide, et la solution mécanique du pro- 
blème d'optique dit problème d'Al-Hazen, dont Huygens 
seulement donnera la solution géométrique. 

L'autre témoin de cette nouvelle sensibilité à la réalité 
géométrique spatiale, Albrecht Dürer, accorde un intérêt 
tout particulier à l'étude des figures de l'espace dans son 
célèbre Underweysung der messung mit dem Zirckel und 
richtscheyt (1525). Il fonde les applications esthétiques 
sur les règles qui permettent de construire les courbes, les 
surfaces et les solides utiles à cette fin; cela le conduit à 
une élaboration des méthodes de perspective, en même 
temps qu'à une première conception des procédés de 
géométrie descriptive élémentaire. 

Synthétique, tournée vers une vue géométrique des 
objets et des mécanismes, à vocation pragmatiste et de 
masse, la mathématique en gestation à la fin du XVE et 
au début du XVIe siècle se trouve favorisée par l'impression 
des œuvres nouvelles et des œuvres de l'héritage ancien, 
et surtout par la conscience du besoin d'un enseignement 
de mathématiques pures : une chaire de mathématiques 
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À Portrait de Luca Pacioli, 
mathématicien italien 
(1445-1510) dont 

le principal ouvrage, 
Summa de arithmetica, 
geometria, proportioni et 
proportionalita, 

résume la somme 

des connaissances 
mathématiques 

de son temps. 


« La « Géométrie », 
dans une miniature 

du traité de Cassiodore 
sur les arts libéraux 
(Paris, Bibliothèque 
nationale). 


Pedicini 


est créée à Bologne en 1496, puis à Vienne, à Paris, à 
Heidelberg, à Coimbra. Le langage mathématique est 
forcé d'évoluer : à côté des abréviations mathématiques 
déjà employées par Diophante, on recourt à de nouvelles 
notations; la voie de l'a/gèbre symbolique se dessine dès 
Chuquet, comme nous l'avons dit, et s'affirme avec Stifel, 
qui emploie les signes — et —, le signe { pour la racine 
d'un nombre, les lettres À, B, C répétées en nombre de fois 
égal au degré, pour désigner les inconnues. Chuquet et 
Stifel mettent en parallèle progression arithmétique et 
progression géométrique, ce qui mènera plus tard à l'in- 
vention des logarithmes. 

Le pas le plus décisif s'accomplit dans l'école italienne, 
avec une pléiade de mathématiciens remarquables, tels 
Scipio del Ferro, Tartaglia, Cardan, Ferrari, Bombelli, qui 
ont donné la solution de l'équation du troisième degré par 
le moyen des radicaux cubiques, ce qui constitue une 
avance incontestable mais n'a pas l'originalité absolue 
que les historiens lui avaient reconnue. C'est d’abord 
Ferro, puis Tartaglia qui redécouvrent la solution de 
l'équation de la forme x? — ax — b, mais sans rien publier; 
Cardan intervient publiquement en 1539, par sa Practica 
arithmeticae generalis, où, avec un incontestable talent 
d’algébriste, il montre une capacité à concrétiser les pro- 
blèmes, à choisir l'inconnue, à utiliser toutes les astuces 
de calcul et à introduire des grandeurs auxiliaires et des 
changements de variable. L'Ars magna énumère toutes les 
formes possibles de ces équations du troisième degré et 
les traite par des méthodes numériques souvent très 
proches des nôtres. 

Le mouvement est couronné par les travaux de Raphaël 
Bombelli. Ce mathématicien ingénieur admit l'existence 
des imaginaires et éclaira ainsi le cas irréductible des 
équations du troisième degré. Les règles de calcul pour 
ces êtres mathématiques nouveaux correspondent à celles 
que nous suivons aujourd'hui. Vers la fin du XVI: siècle, 
l'Italie ne compte plus de mathématicien d'aussi grande 
envergure, et la tradition s'enracine dans le Nord. 

Simon Stevin (1548-1620), ingénieur militaire et ins- 
pecteur des digues dans les États de Hollande, enseigne 
en 1600 les mathématiques à Leyde (dans la langue fla- 
mande). Tourné vers la pratique, le concret, il publie des 
tables d'intérêt, traite des méthodes de comptabilité, mais 
révèle des talents de théoricien dans ses Problèmes géo- 
métriques (1583), où il perce l'analogie entre le continu 
et le discontinu; son Arithmétique occupe une place 
importante dans l'histoire des mathématiques, car elle 
réalise une systématisation et une simplification de 
l'arithmétique et de l'algèbre, et apporte deux innovations 
importantes : l'introduction systématique des fractions 
décimales et une nouvelle conception du nombre qui 
admet les incommensurables au même titre que les entiers 
et les fractions, car « l'incommensurance ne cause pas 
absurdité », et s'élève contre la qualification de nombres 


tels V2 ou 8, comme « absurdes, irrationnels, irréguliers, 
inexplicables où sourds ». Cette unification est d'impor- 
tance pour le développement de l'algèbre et de la géo- 
métrie analytique. 

Ainsi se sont élaborées une pratique et des techniques 
de calcul que l'époque suivante n'aura qu'à examiner pour 
en formuler les principes implicites. 


La science classique 


Si tout est préparé par la Renaissance, si une essentielle 
conquête du réel s'y accomplit qui met les mathématiques 
au service d'un essor artistique sans précédent, d'une 
investigation de l'Univers démystifié et ouvert à la naviga- 
tion transocéanique, aux échanges désormais mondiaux, 
et, plus généralement, au service d'une éducation au 
concret qui entraîne une réorganisation du temps et de 
l'espace, c'est seulement au XVII siècle qu'a lieu l'ini- 
tiation à la modernité et que s'imposent les traits essen- 
tiels de la science classique. 

Il faut d'abord souligner à quel point la mathématique 
est, désormais, imbriquée dans les préoccupations spéci- 
fiques aux sciences de la nature et combien elle est 
étroitement liée à la mécanique, à l'optique et à l'astrono- 
mie. Son rapport à l'expérience est indiscutable, quoique de 
nature complexe. Elle devient une sc/ence utile, porteuse 
du grand rêve cartésien : « parvenir à des connaissances 
qui soient fort utiles à la vie » et « au lieu de cette philo- 
sophie spéculative qu'on enseigne dans les écoles. en 
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trouver une pratique, par laquelle, connaissant la force 
et les actions du feu, de l’eau, de l'air, des astres, des cieux 
et de tous les autres corps qui nous environnent, nous 
les pourrions employer aussi distinctement que nous 
connaissons les divers métiers de nos artisans, nous les 
pourrions employer en même façon à tous les usages 
auxquels ils sont propres, et ainsi nous rendre maîtres 
et possesseurs de la nature ». (Ce texte si célèbre se trouve 
dans le Discours de la méthode, sixième partie, intitulée : 
Choses requises pour aller plus avant en la recherche de 
la nature.) 

C'est donc de manière artificielle que nous n'évoquerons 
pas ici le développement de la physique, renvoyant le 
lecteur à l'histoire de sa mathématisation. Dans le domaine 
strictement mathématique, nous nous limiterons, par 
ailleurs, à l'essentiel, c'est-à-dire à ce qui a fait époque, 
soit en renouvelant complètement une tradition ancienne 
soit en en créant une tout à fait nouvelle. 


L'algèbre : Viète et la « logistique spécieuse » 

Il faut alors, en premier lieu, rappeler le rôle essentiel 
qu'a joué le perfectionnement de l'outil algébrique. Une 
lente et progressive habituation au calcul, à l'algorithme 
qui développe le caractère opératoire de l'algèbre, conduit 
à isoler la notion d'opération. 

Avec Viète (1540-1603) devient usuel le calcul sur des 
symboles, ainsi que l'idée de transformation algébrique 
qui conduit à celle d'une algèbre toute en formules, d'une 
méthode opératoire sur les espèces et formes des choses 
ou « logistique spécieuse ». C'est certainement en cela 
que consiste le progrès décisif de l'algèbre au XVIIe siècle, 
devenir une méthode sous les lois de laquelle se ran- 
gent tous les procédés médiévaux et italiens. Viète mit 
en évidence l'isomorphisme fondamental entre le domaine 
de l'algèbre numérique de Diophante, dont on venait de 
découvrir les travaux, de Cardan, de Tartaglia, de Bombelli, 
de Stifel, et celui de l'analyse géométrique sous-jacente 
aux exposés synthétiques d'Euclide, d'Archimède et 
d'Apollonios dont les œuvres récemment retrouvées de 
Pappus donnent une idée plus précise. Il subdivise l’ana- 
lyse en trois parties : la première, la zététique ou art de 
chercher, consiste à adopter un symbolisme permettant 
de noter tant les grandeurs inconnues que les grandeurs 
connues, à exprimer les liens qui les unissent, à en dégager 
l'équation qui résume, de facon abstraite, le problème 
posé. La deuxième partie étudie, transforme et discute 
cette équation, et la troisième résout l'équation, soit par 
des constructions s'il s'agit de géométrie, soit par des 
calculs numériques s'il s'agit d'arithmétique. On y reconnaî- 
tra les principes mêmes des méthodes modernes. 

La théorie des équations est la première discipline à 
profiter des notations introduites par Viète et améliorées 
par Harriot (1560-1621). C'est Albert Girard (1595-1633) 
qui établit cette théorie sur les relations, mises en évi- 
dence par les méthodes de Viète, entre les coefficients 
et les racines, et dégage le principe qu'une équation a un 
nombre de racines égal à son degré. Descartes, de son 
côté, publie en 1637, en annexe au Discours de la méthode, 
sa Géométrie, dont le livre III expose la théorie des équa- 
tions algébriques. Descartes fait la synthèse des résultats 
obtenus par ses contemporains et le bilan des progrès de 
l'algèbre en exposant, de facon théorique, la manière 
moderne de trouver les racines rationnelles d'une équa- 
tion polynomiale. Mais c'est Newton qui reprendra la 
méthode effective de Viète pour la résolution numérique 
approchée. 


Naissance de la géométrie analytique 

En second lieu, c'est un fait justement célébré que la 
naissance de la géométrie analytique entre les mains de 
Descartes et Fermat, vers la même époque, et indépen- 
damment l'un de l’autre. Elle a consisté en l'application 
de la nouvelle logistique spécieuse à l'analyse des lieux 
géométriques, en particulier des coniques, telle qu'elle 
apparaît chez Apollonios et Pappus. Mais Descartes s'est 
constitué son propre langage et sa propre notation, indé- 
pendamment de la tradition directe de Viète. « Tous les 
problèmes de géométrie se peuvent facilement réduire à 
tels termes, qu'il n'est besoin, écrit Descartes, que de 
connaître la longueur de quelques lignes droites, pour les 
construire. » Toute l'arithmétique repose, précise-t-il, 
sur les opérations arithmétiques usuelles, qu'il suffit 
d'introduire en géométrie; on peut ajouter une ligne a 


à une ligne b et écrire a + b, ôter les lignes a et b l'une 
de l'autre et écrire a — b, etc. Descartes algébrise ainsi 
les opérations géométriques, et inversement, ce qui est 
encore plus important, donne une méthode pour inter- 
préter géométriquement des expressions algébriques, si 
bien qu'à tout nombre correspond un segment, à toute 
opération un calcul segmentaire. C'est pourquoi il s'agit 
d'une invention éclatante, qui, selon l'expression de 
l'historien H. Zeuthen, fait passer la géométrie du stade 
de l'artisanat à celui de la grande industrie. Du fait que 
les concepts géométriques s'expriment algébriquement 
et les expressions algébriques s'interprètent géométrique- 
ment, les deux disciplines acquièrent une vitalité nouvelle. 
Mais cette « quantification » de la géométrie se fonde sur 
la priorité logique accordée à l'algèbre. Pourquoi? Parce 
que, nous dit le cartésien Érasme Bartholin, si « dans les 
commencements il a été utile et nécessaire de donner des 
auxiliaires à notre faculté de spéculation pure : ce pour- 
quoi les géomètres ont eu recours aux figures. », il est 
possible désormais de raisonner directement sur des 
lettres représentant des quantités abstraites. L'algèbre 
est donc une méthode ; c'est une méthode de combinaison 
qui permet, à partir des objets les plus simples, de pro- 
gresser peu à peu dans la connaissance des objets les 
plus complexes. Tandis que la découverte par Fermat 
des coordonnées cartésiennes s'est limitée à une répé- 
tition algébrique de la mathématique grecque, Descartes 
fait de sa découverte une méthode d'invention d'une 
puissance et d'une universalité jusqu'alors inconnues en 
mathématiques : la mathématique grecque est défini- 
tivement dépassée. Il s'agit donc de la première rupture 
épistémologique dans l'histoire des mathématiques depuis 
l'invention hellène de la démonstration. Et au fond de 
cette rupture, il y a le concept de fonction. 


L'apparition du concept de fonction 

Si Descartes a énoncé clairement le principe de base de 
la géométrie analytique lorsqu'il résout le problème de 
Pappus, s'il a trouvé la définition précise des courbes géo- 
métriques, et montré que chaque point de celles-ci 
peut se construire, quelle que soit son abscisse, par une 
suite d'équations de degré de plus en plus grand, il a 
aussi banni de sa Géométrie toutes les courbes non sus- 
ceptibles d'une définition analytique précise, en restrei- 
gnant, en outre, les moyens de cette définition aux seules 
opérations algébriques. C'est pourquoi la géométrie 
analytique exclut de son domaine les courbes que 
Descartes appelle « mécaniques ». Si bien que, comme le 


souligne Bourbaki, Descartes reste en decà de l'idée claire 
et féconde que Barrow (1630-1677) avait déjà du concept 
de fonction. À propos de la courbe définie par x = cte, 


dy _. 2 
y = f (t), avec l'hypothèse que LA soit croissante, Barrow 


dt 
' - ae : (0 SE 
dit expressément qu’ « il n'importe en rien » que gr S'oisse 
« régulièrement suivant une loi quelconque, ou bien irré- 
gulièrement », c'est-à-dire soit susceptible ou non d'une 
définition analytique. Il a fallu attendre le XIX® siècle 
pour que cette idée de Barrow soit précisée. 

Car le disciple de Barrow, le grand Newton, a adopté le 
point de vue « algébrique » de Descartes. Leibniz lui- 
même, qui l'élargit, se contente de l’adjonction explicite 
des courbes exclues par Descartes et de la considération 
implicite des opérations analytiques alors usuelles. C'est 
le « saut » leibnizien dans l'analyse qui explique partielle- 
ment la polémique contre Descartes et son école. « J'ai 
montré, écrit Leibniz, combien la géométrie de Descartes 
est bornée, combien les problèmes les plus importants 
ne dépendent point des équations auxquelles cette géo- 
métrie se réduit, qu'il est ridicule de croire, comme Male- 
branche, que l'algèbre est la plus grande et la plus sublime 
des sciences. » En fait, Leibniz consacre une grande partie 
de ses efforts à méditer sur les séries. Autrement dit, il a 
une idée de la notion de convergence, et ce grâce à 
J. Gregory (1638-1675), qui fut le premier à en avoir conçu 
la nécessité. 


Le calcul infinitésimal 

C'est pourquoi, à l'exception des incursions de Fer- 
mat (1601-1665) dans la théorie des nombres (établis- 
sement de la méthode de descente infinie, du « petit » 
théorème de Fermat : 47 — a (modulo p) pour p premier, 
et du «grand» théorème de Fermat: l'équation x? + y = 77 
n'a pas de solutions rationnelles pour n entier supérieur 
à 2), à l'exception aussi des incursions de Desargues dans 
la géométrie projective (qui nous donnent le concept 
de point à l'infini sur une droite et le « théorème de 
Desargues »), les progrès essentiels en cette période 
concernent des notions étroitement liées à l'analyse. 
Les figures les plus marquantes restent, bien sûr, Newton 
et Leibniz. Tous deux héritent d'une tradition déjà suffi- 
samment établie : celle de Galilée, de Cavalieri, puis 
Barrow, Wallis, puis Fermat, Roberval, etc., qui leur 
permet une synthèse où le calcul infinitésimal acquiert 
presque sa forme classique. 

Newton (1643-1727) est d'abord l'élève de Barrow, 
auquel il succède comme professeur à Cambridge, en 1696. 
Sa formation doit par ailleurs à Descartes, dont il étudie 
la géométrie, à Wallis, à Mercator (1620-1687), fami- 
liers des calculs liés à des séries de puissances. Son apport 
à la mathématique ne se limite pas à son œuvre mathé- 
matique proprement dite. Sa physique ou Philosophiae 
naturalis principia mathematica résume tout le progrès 
géométrique des siècles passés. L'Arithmetica universalis 
(1707) etle 7ractatus de quadratura curvarum développent 
amplement les techniques de la géométrie analytique ; le 
Methodus fluxionum et serierum infinitarum, paru en 1736, 
après sa mort, systématise des idées dont les premières 
remontent à 1665. 

Le calcul infinitésimal de Newton est lié à l'étude 
mécanique du mouvement d'un point, et, plus précisément, 
à la détermination de la vitesse à un temps t donné, quand 
la longueur du segment parcouru est donnée, ou de la 
distance parcourue, à un temps #, quand c'est la vitesse 
qui est donnée. Le temps apparaît donc comme une 
variable indépendante : il s'agit non du temps physique, 
mais d'une grandeur dont la croissance uniforme repré- 
sente et mesure le temps. Newton se sert des notions et 
des notations algébriques de Barrow : la distance par- 
courue est la « fluente » de la vitesse : s = v; et, inverse- 
ment, la vitesse v est la « fluxion » de la distance s: 
v = s (la «fluxion » est ce que Leibniz appelle le « quotient 
différentiel » d'une fonction; la « fluente » |’ « intégrale » 
d'une fonction). Bientôt (1676), Newton s'aperçoit qu'on 
peut réitérer le procédé qui lie la fluente à la fluxion, 
de façon à obtenir une suite de grandeurs dont chacune est 
la fluxion de celle qui la précède et la fluente de celle qui 
la suit; la méthode algébrique s'applique ainsi à des 
relations fonctionnelles, d'une généralité plus grande que 
les grandeurs auxquelles la limitait Descartes. 
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< Descartes est considéré, 
notamment, comme 

le fondateur de la géométrie 
analytique (Portrait 

de F. Hals, Paris, Louvre). 


» Figure 13: 
représentation schématique 
du problème du triangle 
caractéristique pour lequel 
Leibniz inventa son calcul 
des différences. 
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À Le philosophe 

et mathématicien allemand 
G. Leibniz (7646-1716); 

il publia, en 1684, 

une Nouvelle Méthode 
pour la détermination 

des maxima et des minima, 
qui contient les principales 
lignes du calcul 
infinitésimal. 


> Figure 14: 
voir démonstration 
dans le texte page 299. 


Illustrons par un exemple la méthode des fluxions. Soit 
à calculer la fluxion de l‘équation : z3— zy? + a2x— b3 —0O, 
où x, y et z dépendent de t et où a et b sont des constantes. 
On calcule successivement les fluxions de z, de y et de x: 


(1) Pour z3-—zy? ona: 3z?z— y? 

(2) Pour — zy? ona: —27zyy 

(3) Pour a?x ona: ax 

(4) Pour — b3 ona: O d'où l'équation : 
(5) 3 22z— 2y2— 2 zyy + ax = 0 


En désignant par O0 une quantité très petite, différente 
de zéro, Oz, 0y et 0x seront les moments des fluentes z, 
y et x. Les fluentes s’accroissent de leurs moments quand 
t s'accroît de 0; d'où : 


(z2+ 07) — (z+ Oz) (y + O7}? + a? (x + Ox) — b3 = 0. 


De cette dernière équation, on soustrait l'équation donnée, 
puis on divise par 0 qui est différent de 0; on obtient : 
3 z2z + 3 Ozz2 + 0273 zy2_ 2 zyy — 
2 Ozyy — Ozy? — O2zy? + a2x — 0. 
En faisant tendre © vers O, il vient : 
3 z2z— zy?2— 2 zyy + ax = 0. 

On y reconnaîtra la définition de la dérivée d'une fonc- 
tion : 

lim F(z2+h)—f (2). 
h—0 h 
hæ0 

Ainsi Newton évite dans sa technique de démonstra- 
tion aussi bien les anciennes démonstrations par l'absurde 
que la méthode de Cavalieri qui repose sur les indivisibles ; 
il introduit les « quantités évanouissantes », de manière à 
pouvoir assigner les /imites assignables à des sommes et à 
des rapports de quantités déterminées prises à leur état 
de naissance ou d'évanouissement. Les quantités mises 
en relation dans l'expression de ces limites sont des élé- 
ments infinitésimaux de quantités finies, des moments, 
qui n'interviennent dans le calcul que par leur première 
proportion à la naissance. 

De son côté, Leibniz, homme de système comme Des- 
cartes, concoit, à la même époque que Newton, son 
Calculus differentialis et son Calculus summatorius pour 
résoudre deux problèmes distincts et, pour lui, inverses 
l'un de l’autre : celui des tangentes et celui des somma- 
tions (c'est-à-dire de l'intégration). Ses conceptions sont 
exposées dans deux mémoires publiés dans les Acta eru- 
ditorum (1684 et 1686) et dans la correspondance qu'il 
entretint avec les savants de son époque. 

Dans un système de coordonnées cartésiennes, toute 
courbe s'exprime par une équation. On peut donc, pre- 
mièrement, se demander quelle direction doit suivre une 
droite pour que, passant par un point de la courbe, elle 
y soit tangente : ce problème revient, selon Leibniz, à 
calculer les différences infinitésimales, puisqu'il est néces- 
saire de comparer différentiellement un point de la courbe 
avec le point immédiatement précédent. La comparaison 
des deux points immédiatement voisins donne la « loi » 
du changement de direction de la tangente (en suppo- 
sant que le parcours de la courbe est continu et conforme 
à une loi). Inversement, si on connaît une formule expri- 
mant la variation de direction de la tangente à une courbe, 
il doit être possible d'établir l'équation inconnue de cette 
courbe, sa « fonction primitive ». La découverte géniale 
de Leibniz est d'avoir vu que ce deuxième problème revient 
à une rectification ou mesure d'un arc de courbe. Déter- 
minant pour cette découverte fut le séjour de Leibniz à 
Paris, comme on peut l'apprendre par une lettre de l'auteur 
à Jacques Bernoulli : « Lorsque je vins à Paris, en 1672, 
j'étais un géomètre autodidacte, mais peu expérimenté, 
n'ayant pas la patience de parcourir la longue série des 
démonstrations C'est alors aussi que Huygens, qui me 
croyait, je présume, plus capable que je l'étais, m'apporta 
un exemplaire nouvellement édité du Pendule. Ce fut 
pour moi le commencement ou l'occasion d'une étude 
géométrique plus approfondie. Pendant que nous nous 
entretinmes, il me fit voir que je n'avais pas une notion 
assez exacte des centres de gravité. en ajoutant que 
Dettonville (Pascal) avait très bien traité cette question. 
Sans aucun retard, j'étudiais ces produits, ces onglets 
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inventés par Vincent et perfectionnés par Pascal. Je voyais 
avec plaisir ces sommes, et les sommes de ces sommes, 
les solides qui en naissaient et leurs démonstrations. 
Tout cela me donnait plus de plaisir que de travail. J'en 
étais là lorsque, par hasard, je tombai sur une démons- 
tration de Dettonville, très facile de son espèce. Mais 
quel fut mon étonnement de voir que Pascal avait eu 
les yeux fermés comme par un sort : car je vis aussitôt 
que le théorème pouvait s'appliquer généralement à toutes 
les courbes, bien que les perpendiculaires ne se rencon- 
trassent pas dans un même centre. Je m'en vais aussitôt 
chez Huygens. et je lui exposai mon théorème général 
sur la rectification des courbes. II fut saisi d'étonnement 
et me dit que c'était là le théorème sur lequel s'appuyaient 
ses constructions pour trouver les aires des conoïdes 
parabolique, elliptique et hyperbolique. » (Cité dans le 
tome Il de l'Histoire générale des sciences et des tech- 
niques, P. U.F., pp. 235-236.) 

Ainsi l'impulsion de Huygens et ses conseils, la lecture 
de Pascal (Traité des sinus du quart de cercle), l'étude des 
géomètres contemporains ont conduit Leibniz à voir dans 
l'étude du triangle caractéristique l'outil essentiel pour 
résoudre le problème des tangentes pour des courbes 
quelconques, puis à concevoir la rectification des courbes 
comme un problème inverse du premier. Il introduit la 
notation encore usitée de nos jours, soit, pour l'intégrale : 
Î y dy, et pour la différentielle : dx, Î désignant une somme, 
tandis que d représente une différence. 

Voyons sur un exemple comment raisonnait Leibniz 
(fig. 13). Considérons une droite tangente à une courbe 
en un point À, qui s'écarte de cette courbe aux points 
B et C; B et C peuvent être les extrémités de l'hypothé- 
nuse du triangle rectangle dont les côtés de l'angle droit 
sont parallèles aux axes de coordonnées. Ce triangle est 
semblable au triangle formé par la normale à la courbe au 
point À, la parallèle à l'axe des ordonnées passant par 
A et le segment déterminé sur l'axe des abscisses par les 
points d'intersection de ces deux dernières droites avec 
lui. Si B et C se meuvent vers À, le triangle BDC deviendra 
de plus en plus petit, tout en gardant les mêmes propor- 
tions à cause de la continuité des lignes, et restera donc 
semblable au triangle AEF; celui-ci, reproduction très 
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grande du triangle BDC, est le triangle « caractéristique »; 
la loi des tangentes pourra être exprimée par un rapport 
entre les côtés du triangle caractéristique, par une fonction 
de l'angle d'inclinaison de la tangente sur l’un des axes 
de coordonnées. D'où la nécessité d'établir l'équation 
de cette fonction et son rapport avec l'équation de la 
courbe, ce pour quoi Leibniz invente son calcul des diffé- 
rences et, par passage à la limite, le calcul différentiel. 
Pour un accroissement Ax de la valeur de l'abscisse, 
l'ordonnée y s'accroît de Ay (fig. 14). Dans le cas d'un 
accroissement fini, on considère l'angle « que fait la 
sécante à la courbe passant par les points P et R, avec 
l'axe des abscisses, et on obtient la tangente de «x comme 
quotient de Ay par Ax. Mais si y = f (x), 
Ay=f(x+ Ax) —f(x), 
Ay _f(x+ Ax) —f (x). 
Ax Ax 


Ce rapport donne donc la tangente trigonométrique de 
l'angle «. Et comme on s'intéresse surtout à la tangente 
au point P, l'accroissement de la variable x doit avoir 
une valeur infiniment petite dx, à laquelle correspond un 
accroissement dy de y; on procède comme dans le cas 
des différences finies, en écrivant le rapport : 

dy _ f(x + dx) —f (x), 
dx dx 
Le passage du cas fini au cas des accroissements infini- 
ment petits s'exprimerait aujourd'hui par l'équation : 
dy Ay 
dx Ax-—>0 AX 


d'où 


tg x 


Leibniz ne distinguait pas par l'écriture Ay de dy, 
bien qu'il fit parfaitement la distinction entre une diffé- 
rence et une différentielle, distinction que le lecteur saisira 
aisément en se reportant à la figure 15. 

Telle est l'allure de l'invention leibnizienne qui couronne, 
avec celle de Newton, les découvertes successives du 
XVIIe siècle. L'aboutissement en est la création de l’ana- 
lyse du XVIIIe siècle dans sa double relation aux problèmes 
de physique mathématique d’une part, et d'autre part, 
à travers les développements donnés par les frères Ber- 
noulli au calcul leibnizien, à la résolution des équations 
différentielles. 


Le XVIII° siècle 


La richesse de la grande invention du XVIIe siècle appa- 
raît au siècle suivant dans ses applications à la physique 
et à la géométrie. Le siècle des lumières foisonne en décou- 
vertes; les premières sont dues à de Moivre, Taylor et 
Stirling, pour ne citer que les noms les plus illustres de 
l'école britannique, et aux frères Bernoulli sur le continent ; 
puis le siècle culmine avec l'œuvre de Leonhard Euler 
avant de s'achever par la publication des grands traités 
de l'École de Paris par Lagrange, Laplace, Monge, Legen- 
dre et Lacroix. 


Les Bernoulli 

Jacques Bernoulli (1654-1705) s'initia au calcul de 
Leibniz dont il défendit et propagea les méthodes à la 
fois dans son œuvre et dans son enseignement à l’univer- 
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sité de Bâle. Il est resté célèbre par l'introduction, à l'occa- 
sion de la sommation des puissances p-ièmes des pre- 
miers entiers, des nombres dits « de Bernoulli », par une 
théorie des probabilités contenue dans son Ars conjec- 
tandi, par le recours au raisonnement par récurrence, etc. 
Dans ses travaux sur les séries, il établit la divergence de 
la série harmonique; il résolut le problème de la ligne 
isochrone, posa celui de la chaînette, résolu par Huygens, 
Leibniz et Jean Bernoulli. Il étudia les courbes élastiques 
et s'attaqua à de nombreuses autres questions, dont cer- 
taines ont conduit à une problématique de géométrie 
infinitésimale, d'autres, comme celle des isopérimètres, 
à l'ébauche du calcul des variations. 

Jean Bernoulli (1667-1748), nommé d'abord pro- 
fesseur à Groningen, succéda à son frère Daniel à Bâle, 
en 1705. On lui doit les premiers manuels de Ca/cul 
différentiel et intégral, qui consignent ses cours de 
l'année 1691-1692. Par ailleurs, il étudia l'exponentielle 
y = x? = ef Logz, (x > O0), la ‘sêrie « de Bernoulli » : 


1 
a *Y" F 4 
la chaînette, les lignes isochrone et brachistochrone, et 
la cycloïde ; il fit le premier emploi des coordonnées polaires 
et une étude systématique des équations différentielles 
du premier ordre, en recourant notamment aux méthodes 
de séparation des variables et de variation des constantes. 
Enfin, il contribua à la formation de Leonhard Euler. On 
sait, d'autre part, que le marquis de L'Hôpital doit à 
Jean Bernoulli le contenu de son livre sur l'Analyse des 
infiniment petits. 

Outre Daniel Bernoulli (1700-1782), le fils de Jean, 
il faut aussi mentionner A. Claude Clairaut, qui appliqua 
l'analyse à des problèmes géométriques et prit part à 
l'étude des équations différentielles. 


z 1 SA à 
L ydx = XY— 355% WE 


L'école anglaise 

Les noms de Taylor (1685-1731) et de Maclaurin (1698- 
1746) sont indissolublement liés à la théorie des séries. 
La célèbre formule de Taylor se trouve dans sa Wethodus 
incrementorum directa et inversa (1715) : 


2 
FC D) = F O9 + RP O9 + EP (0 + 


tandis que celle de Maclaurin en explicite un cas parti- 
culier, celui où x = 0 et À = x. 

Stirling (1692-1770) est surtout connu pour sa formule 
d'approximation de n! (pour n entier très grand) : 


n'£ nr-e7r 2 rn. 
Abraham de Moivre (1667-1754) se signale par la série : 
Boy n1-2# 
2k(2k—1) 


© 
Log n!= Log ÿ27n + n:Logn—n+ > 
k=1 
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<« Figure 15 : 
représentation schématique 
illustrant la distinction 
entre une différence 

et une différentielle. 


« Le mathématicien 
Abraham de Moivre 
(1667-1754) introduisit 

la trigonométrie 

des quantités imaginaires 
et donna dans ce domaine, 
en 1730, la formule 

gui porte son nom. 


Palais de la Découverte - Paris 


À Le mathématicien 
L. de ane (1736-1813). 


où les coefficients B24 sont les nombres de Bernoulli, 


tandis que la formule à laquelle il a laissé son nom : 


(cos x + j sin x)? — cos nx + j sin 7x 


est en réalité due (sous sa forme connue) à Euler. 


Les travaux d’Euler 

Leonhard Euler (1707-1783) est un des mathématiciens 
les plus féconds et les plus profonds de tous les temps. 
Fils d'un pasteur de Bâle, il étudie d’abord la théologie et 
se découvre une vocation de mathématicien en écoutant 
les cours de Jean Bernoulli. On le trouve en 1727 à 
l'Académie de Saint-Pétersbourg, où il est professeur 
de physique en 1730 et de mathématiques en 1733. 
Appelé en 1741 à l'Académie de Berlin, il y dirige en 1745 
le département de mathématiques; il rencontre là Mau- 
pertuis et d'Alembert. Euler est important à la fois par 
son génie créateur et par ses manuels, qui exercèrent une 
grande influence; l‘/ntroductio in analysin infinitorum 
(1748) est le plus célèbre de ses ouvrages, et le premier 
traité classique d'analyse. Euler y fait une étude systéma- 
tique des fonctions élémentaires, qu'il classe suivant leur 
mode de formation. Une fonction est définie comme une 
expression analytique formée d'une manière quelconque 
à partir d'une quantité variable et de constantes; les 
expressions polynomiales, les séries entières, les expres- 
sions logarithmiques ou trigonométriques sont permises, 
ce qui autorise la considération de fonctions de plusieurs 
variables. 1l distingue (comme Jean Bernoulli) les fonc- 
tions algébriques et les fonctions transcendantes, ces 
dernières pouvant être engendrées par des séries infinies, 
puis les fonctions explicites et les fonctions implicites, 
enfin les fonctions uniformes et les fonctions multiformes. 
En 1749, à propos de l'équation aux dérivées partielles 
des cordes vibrantes, Euler est conduit à élargir sa défi- 
nition du concept de fonction de manière à ne plus exclure 
les courbes tracées au hasard sur le plan. Sa classification 
a le mérite d’avoir mis au centre de l'organisation de 
l'édifice analytique ce concept de fonction, en facilitant 
ainsi le travail critique qui s'appliquera ultérieurement à 
redéfinir les notions fondamentales de l'analyse. 

Les /nstitutiones calculi differentialis (1755) montrent 
un égal souci de rigueur. Contrairement à Maclaurin, 
par exemple, qui tenta d'asseoir le calcul infinitésimal 
sur la géométrie, et en particulier sur la méthode d'exhaus- 
tion telle qu'elle est utilisée par Archimède, Euler se tourne 
plutôt vers la manipulation formelle des expressions algé- 
briques, ce qui le conduit à identifier les quantités infi- 
niment petites ou évanouissantes à de simples zéros; 
les différentielles dx et dy sont considérées comme nulles, 
puisqu'elles n'ont pas de grandeur assignable, et le 

. - dy : 
problème se pose d'expliquer que le rapport de” qui a la 


forme indéterminée 5’ puisse égaler une quantité déter- 


minée. Euler pense que, puisque n° 0 = O pour tout 


3: et le calcul de la dérivée 


de la fonction considérée sert à déterminer précisément 
ce rapport. (dx)? s'évanouit avant dx, en sorte que le 
rapport de dx + (dx)? à dx est égal à 1. Euler est donc 
conduit à distinguer différents ordres d'infini, bien qu'on 


nombre », on peut avoir n = 


: à dd a 
ne disposât alors que de l'unique symbole © : = est 


0 


un infini de premier ordre, tandis que est un infini 


CA (ax 
de second ordre, etc. 

Les /nstitutiones calculi integralis (1768) constituent, 
avec l'ouvrage précédent, une somme de résultats et une 
référence irremplaçable avant la publication par Lacroix 
des deux volumes de son 7raité de calcul différentiel 
et intégral (Paris, 1797-1800). Euler y étudie l'intégration 
des fonctions rationnelles, irrationnelles et transcendantes 
élémentaires (l'intégration étant considérée comme l'opé- 
ration inverse de la dérivation); les équations différen- 
tielles sont intégrées par la technique de séparation des 
variables ou par le biais des développements en série; 
des indications sont données sur l'intégrale elliptique 
et le calcul des variations. Souvent indécis sur les concepts 
fondamentaux de l'analyse, les manuels d'Euler fourmillent 
de trouvailles, dont il nous faut citer les plus importantes 
pour faire le point. 
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— Euler s'est intéressé à l'équation diophantienne 
X2— py?= 1 en en cherchant les solutions entières 
(1733, 1759); plus tard, il donna une démonstration 
élégante du théorème de Wilson : 


(p—1)!=—1 (mod p). 


— Il à donné au petit théorème de Fermat une 
expression plus générale grâce à l'emploi de la fonction 
dite d'Euler : © (n) étant le nombre des entiers inférieurs 
à n et premiers avec lui. 

— Il a montré l'irrationalité des nombres e et e?; 
c'est, du reste, à lui que nous devons cette notation e, 
ainsi que la vulgarisation des symboles j et x. 

co 
— Il à établi la divergence de la série pa 
n= 1 


p? 


(p premier) et donné une valeur pour la fameuse constante 
d’Euler : 


ge 
EN 
| 
1 
| 
1 
ll 


Log n) = 0,577 2 


— Il a établi la formule : eî7 — cos x + j sin x. 


— Les intégrales d'Euler : 
s1 pl 
| x? (1— x)2 dx et | x? ex dx 
0 Jo 
(p et q entiers positifs) sont bien connues aujourd'hui 
sous les noms de fonction 8 et fonction I". 
— Euler, enfin, ouvre un nouveau chapitre dans 
l'arithmétique, en étendant la notion de divisibilité aux 
entiers d'une extension quadratique quelconque. 


L'école française 

L'œuvre immense d'Euler, parachèvement de celle de 
Leibniz, fut décisive dans la préparation du courant cri- 
tique qui se développe déjà dans la réflexion de D'Alem- 
bert et les doutes qu'il exprime sur l'usage des séries non 
convergentes. D'Alembert, en effet, s'est efforcé, dans 
les articles Différentiel et Limite de l'Encyclopédie et dans 
les Éclaircissements sur les éléments de philosophie 
(1767), d'exposer les propriétés des infiniment petits 
d'une manière systématique et claire et de montrer que 
toute la « métaphysique » du calcul infinitésimal se réduit 
aux concepts de dérivée et de limite. 

L. de Lagrange (Turin, 1736 - Paris, 1813) exerça une 
influence décisive sur la tradition analytique française 
qu'il contribua à créer par son enseignement, d'abord à 
l'École normale de l'an III, puis à l'École polytechnique 
(Lagrange, d'abord professeur à l'école d'artillerie de 
Turin, avait succédé à Euler à l'Académie de Berlin; 
c'est en 1787 qu'ilse fixe à Paris). De cet enseignement il a 
tiré la matière de ses ouvrages essentiels : la Mécanique 
analytique (1788), la Théorie des fonctions analyti- 
ques (1797) et les Lecons sur le calcul des fonc- 
tions (1799). Ayant traité de domaines variés qu'il a 
souvent renouvelés, tels que les équations différentielles, 
le calcul des variations, etc., il s'est également illustré 
par ses mémoires algébriques qui inaugurent une période 
décisive pour la théorie des équations algébriques. Dans 
le mémoire de 1771 (Réflexions sur la résolution algé- 
brique des équations), il écrit : « Je me propose d'exa- 
miner les différentes méthodes que l'on a trouvées jusqu'à 
présent pour la résolution algébrique des équations, de 
les réduire à des principes généraux et de faire voir a priori 
pourquoi ces méthodes réussissent pour le troisième et 
le quatrième degré, et sont en défaut pour les degrés ulté- 
rieurs. » Lagrange s'intéresse ainsi aux méthodes plus 
qu'aux équations elles-mêmes, d'une manière a priori, 
expliquant réussites et échecs des tentatives antérieures 
pour établir des formules de résolution. Bref, comme l'a 
écrit Bourbaki, Lagrange procède à « une analyse systé- 
matique des problèmes posés et des méthodes suscepti- 
bles de les résoudre, analyse qui, en soixante ans, conduira 
aux résultats définitifs de Galois ». 

Pierre-Simon de Laplace (1749-1827) applique les 
procédés de l'analyse aux probabilités, ce qui le conduit à 


no 
étudier l'intégrale | et? du. La Théorie analytique des 
Jo 
probabilités (1812) donne une synthèse de toute l'œuvre 


du siècle en ce domaine. Laplace s'est également inté- 
ressé aux équations aux dérivées partielles, en donnant 


Giraudon 


d?o 
dxi? 


rôle important dans la théorie des fonctions, et surtout à la 
Mécanique céleste, à laquelle il a consacré un traité 
monumental en cinq volumes (1799-1825) qui couronne 
les travaux de Newton, Clairaut, d'Alembert, Euler et 
Lagrange sur le système des planètes, la forme de la 
Terre, la gravitation et le problème des trois corps. 

Le dernier des trois grands analystes français, Adrien- 
Marie Le Gendre (1752-1833), appartient déjà au début 
du XIXe siècle par ses traités sur la géométrie (1794), sur 
la théorie des nombres (1798), sur les fonctions ellip- 
tiques et sur les intégrales eulériennes (1825-1832), 
ainsi que par ses exercices de calcul intégral. Ses pre- 
miers travaux, qui datent d'avant la coupure de 1789, 
concernaient le calcul des variations, les équations aux 
dérivées partielles et la géodésie. 

En cette fin du XVIIIe siècle, outre la percée algébrique 
de Lagrange dont nous avons parlé plus haut, le phéno- 
mène le plus important est sans doute l'application par 
Gaspard Monge (1746-1818) de l'analyse à la géométrie 
et à la mécanique. Monge crée la Géométrie descriptive 
(1794-1795), ouvre la voie, avec son élève Poncelet, 
à la géométrie projective complexe. Aussi Bourbaki 
reconnaît-il « sous le nom de ‘principe des relations 
contingentes” chez Monge, ou de‘ principe de continuité” 
chez Poncelet, le premier germe de l'idée de ‘’spéciali- 
sation” de la géométrie algébrique moderne ». Notons 
aussi que les Feuilles d'analyse appliquée à la géomé- 
trie (1795) de Monge préparent à la naissance, au siècle 
suivant, de la géométrie différentielle. 

Nous n'avons pu évoquer ici tous les travaux mathé- 
matiques, non plus que tous les mathématiciens du 
XVIIIe siècle : nous n'avons rien dit, par exemple, d'A. 
de Vandermonde, de Lambert (1728-1777), de Waring 
(1734-1793), des autres membres de la dynastie des 
Bernoulli. C'est que, faute de pouvoir retenir tous les 
détails, nous avons voulu surtout souligner la percée des 
mathématiques vers des formes inédites : vers une réflexion 
sur ses concepts fondamentaux que le XIX® siècle déve- 
loppera pour mettre de l'ordre dans le foisonnement des 
découvertes accumulées. 


5 
son nom à l'équation : = Ag = 0, qui jouera un 
i=l 


Le XIX°e siècle 


Le XIX® siècle mathématique nous montre une disci- 
pline en plein essor : multiplication des travaux, exten- 
sion et diversification des recherches. Trois traits cepen- 
dant dominent cette période : 

— le renouvellement profond de disciplines bien 
connues, consécutif au souci de rigueur logique et à 
l'esprit d'abstraction qui avaient commencé à poindre 
au siècle précédent : ainsi en est-il de l'algèbre avec 
Gauss et Galois, de l'analyse avec Cauchy, Bolzano et 
Weierstrass, et de l'arithmétique, à la fin du siècle: 

— la conquête de domaines absolument nouveaux 
par des disciplines inédites : théorie des groupes, théorie 
des fonctions ou théorie des ensembles (nous ne dirons 
rien de l'histoire de cette discipline, devenue le centre 
des mathématiques contemporaines: on se reportera au 
chapitre qui lui est consacré): 

— le rapide développement de la physique mathé- 
matique qui profite de l'outil mathématique, mais pose, 
en retour, des problèmes féconds dont l'étude oriente 
l'évolution de certaines branches. 

Des facteurs politiques et socio-économiques com- 
mandent cette éclosion. Par sa réforme de l'enseigne- 
ment supérieur scientifique et technique, la Révolution 
française accorde aux mathématiques une place bien 
plus grande que par le passé dans les programmes sco- 
laires et dans la société (voir Mathématiques et société). 
On sait le rôle joué par l'École polytechnique d'abord, 
l'École normale supérieure ensuite, dans la formation de 
mathématiciens de premier ordre. Des revues spécialisées 
voient le jour : Journal de l'École polytechnique (1795), 
Annales de mathématiques de J.-D. Gergonne (1811- 
1832), Journal de mathématiques pures et appliquées 
de J. Liouville (1837), etc.; et les Comptes rendus de 
l’Académie des sciences, fondés en 1835, assurent la 
diffusion rapide des résultats nouveaux. À la faveur des 
nationalismes politiques et des progrès de l'industrie, ce 
mouvement s'étend à d'autres pays d'Europe ou d'Occi- 
dent : en Allemagne, où les universités de Gôttingen, de 
Berlin, de Kônigsberg, Bonn, Halle, etc., disputent rapi- 
dement à Paris le privilège de centre de recherche et de 
rayonnement, et où est édité, à partir de 1826, le célèbre 
Journal de Crelle (Journal für die reine und angewandte 
Mathematik) ; en Angleterre, en Italie, en Russie même. 
Un peu partout sont fondées des sociétés mathéma- 
tiques : London Mathematical Society (1865), Société 
mathématique de France (1872), Circolo matematico di 
Palermo (1884), American Mathematical Society 
(1888), etc. 

Le premier congrès international de mathématiques eut 
lieu à Zürich en 1897. 

La richesse et la diversité des acquis sont telles que nous 
commençons l'histoire de ce siècle par un tableau 
(tableau V) qui ne prétend pas à l'exhaustivité, mais où 
le lecteur trouvera les repères indispensables. 


Le renouveau de l'algèbre 


Théorie des équations et théorie des groupes 

En algèbre, comme en de nombreux autres secteurs, 
le siècle est dominé, à son début, par le génie et la puis- 
sance de Carl Friedrich Gauss (1777-1855). C'est lui 
qui donne, dès sa thèse (1799), la preuve du théorème 
fondamental de l'algèbre, selon lequel tout polynôme 
de degré n a exactement n racines. Ce théorème avait 
été énoncé pour la première fois en 1629 par Girard, puis 
démontré, mais de façon imparfaite (en 1746), par 
D'Alembert et Euler. La démonstration de Gauss, qui 
utilise des résultats d'analyse alors connus, présuppose 
l'existence des nombres complexes. 

Mais au début de ce XIX® siècle, le problème principal 
demeure celui de la résolubilité des équations de degré 
supérieur à 4. Sa solution, amorcée dans les travaux de 
Lagrange et de Vandermonde, interviendra avec le déve- 
loppement de la théorie des groupes et de la théorie des 
corps. C'est dans cette perspective que s'inscrivent 
l'effort de Gauss relatif à la résolution de l'équation 
x? — 1 = 0, qui lui fait pressentir la notion de groupe 
cyclique, et l'étude de Paolo Ruffini (1765-1822) du 
comportement des fonctions rationnelles des racines lors 
des permutations de celles-ci, par laquelle il tente de 
prouver l'impossibilité de la résolution de l'équation géné- 
rale du 5° degré. 
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« Le mathématicien 
français Gaspard Monge 
(1746-1818), dont 

les ouvrages et 
l'enseignement oral eurent 
une influence considérable 
sur tous les mathématiciens 
du XIXe siècle. 


Avant 1800 


On connaît les différentes sortes 
d'opérations et de nombres. 


On a une théorie élémentaire 


des nombres. 


L’algèbre est surtout développée 
comme théorie des équations. 


Éléments d'analyse avec des 
applications à la géométrie 
et à la physique. 


Manipulation des séries dans 
le calcul différentiel et intégral, 


Tableau V 


Après 1800 


On a le concept de nombre réel, 
la théorie des nombres complexes et 
hypercomplexes, le calcul vectoriel. 


On dispose de formes quadratiques, 
de la théorie des nombres algébriques, 
et d’une théorie analytique 

des nombres. 


L’algèbre gagne en généralité ; 
les théories des groupes et des 
invariants font leur apparition. 


L'analyse classique se constitue et 
s'organise autour de concepts 
précisément définis. 

Théorie des fonctions et géométrie 
différentielle se développent comme 
des branches autonomes. 


Théorie rigoureuse de la convergence. 
Invention des séries de Fourier. 


surtout des séries entières. 


Géométrie analytique. 


Géométrie descriptive. 


À Tableau V : 

les grands moments 
mathématiques 

du XIXe siècle. 


Algèbre linéaire. 


Géométrie projective, topologie, 
théorie des ensembles, 

logique mathématique, telles sont 
les dernières créations du siècle. 


Après Abel (1802-1829), qui montre plus rigoureu- 
sement que Ruffini l'impossibilité de résoudre par radi- 
caux l'équation générale du 5° degré, et recherche les 
critères caractérisant les équations résolubles par radi- 
caux, c'est Évariste Galois (1811-1832) qui présente 
à l'Académie des sciences un mémoire sur ce sujet 
(1831). À la base de la théorie de Galois, qui ne 
fut vraiment connue qu'après que Liouville eut publié, 
en 1846, les œuvres de ce génie tué à 21 ans dans un 
duel, on trouve les notions de corps, esquissées par 
Gauss en 1801, d'adjonction et de polynôme irréductible 
sur un corps donné, qui seront développées par Riemann 
et Dedekind. On y trouve aussi les principes de la théorie 
des groupes de substitution. 

L'idée fondamentale de la théorie de Galois est qu'une 
équation algébrique est résoluble par radicaux si et 
seulement si un certain groupe, le groupe de Galois de 
l'équation, possède la propriété d'être « résoluble ». 
Or, le groupe de Galois d'une équation est isomorphe à 
un groupe de permutations de ses racines, si bien qu'on 
découvrira les propriétés d'une équation à coefficients 
sur un corps K en étudiant l'ensemble des permutations 
de certains éléments du plus petit sur-corps de K, L, 
obtenu à partir de K par adjonction des racines de 
l'équation. 

La théorie de Galois permet, en particulier, de résoudre 
les problèmes, posés depuis l'Antiquité, de construction 
à la règle et au compas : ni la trisection de l'angle, ni la 
duplication du cube, ni la quadrature du cercle ne sont 
possibles à la règle et au compas. 

A. Cayley appliqua la théorie des groupes aux qua- 
ternions (1854), et Hamilton étudia les groupes de 
symétrie des polyèdres réguliers; mais ce n'est qu'après 
le Traité des substitutions de Camille Jordan (1838- 
1922) que l'importance des idées de Galois apparut en 
plein jour et que la théorie des groupes intervint dans 
les secteurs les plus divers (de la géométrie aux équations 
différentielles). C'est par le biais de la notion de groupe 
qui révèle ainsi, sous la diversité des représentations et 
des langages, l'identité des lois et des opérations, que 
l'idée de structure abstraite fit sa première entrée dans 
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les mathématiques mocernes. Après 1870, Sophus Lie 
et Felix Klein profiteront de ce nouvel outil pour faire 
ressortir, dans la diversité des théories, l'unité structurelle 
de la géométrie. 


L'algèbre linéaire - Les algèbres 

Un des traits caractéristiques du XIX® siècle mathé- 
matique est le relief de plus en plus marqué que prennent 
les problèmes linéaires : étude des déterminants, intro- 
duction des matrices, étude des formes algébriques et 
des invariants, théorie des quaternions et des nombres 
hypercomplexes, introduction de nouveaux types d'al- 
gèbres. L'algèbre linéaire proprement dite, d'abord 
limitée à l'étude des systèmes d'équations algébriques 
du premier degré, s'étend aux systèmes d'équations 
différentielles et aux dérivées partielles, et sa force 
d'explication trouve une heureuse application en 
géométrie. 

Nous devons à Cauchy l'introduction du terme « déter- 
minant », dans son sens moderne, à Cayley notre notation 
actuelle, mais ce sont les travaux de Jacobi (1795-1855) 
qui posent les principes de la théorie générale des déter- 
minants et contribuent à la diffusion de ce nouvel algo- 
rithme. 

Extensions du concept de déterminant, les matrices 
apparaissent dans les études sur la composition homo- 
graphique de Cayley, dès 1843, et sont précisément défi- 
nies par lui en 1858. Entre-temps, Hamilton les a égale- 
ment introduites dans ses Lectures on Quaternions 
(1853), et le calcul géométrique de Grassmann les utilise 
implicitement. Le succès du calcul matriciel est remar- 
quable à la fin du siècle, dans l'école anglaise, avec 
Clifford et Sylvester, puis en Amérique, avec Benjamin 
Peirce qui l'utilise dans sa théorie des algèbres linéaires 
associatives. 

Le concept d'invariant est tout aussi important et tout 
aussi distinctif que celui de groupe; lui aussi permet 
l'unification de questions algébriques et géométriques. 
Il s'impose dans l'étude des formes algébriques, c'est- 
à-dire des fonctions homogènes à plusieurs variables. 
Dans un système de coordonnées homogènes, l'équation 
d'une courbe plane, ou d'une surface, se ramène à 
l'annulation d'une forme binaire, ou ternaire, et les chan- 
gements de coordonnées reviennent à des substitutions. 
L'étude des propriétés de figures équivaut donc analyti- 
quement à celle des propriétés des formes et conduit à 
leur réduction à leur forme canonique et à la recherche 
de leurs invariants et covariants, c'est-à-dire aux fonc- 
tions de leurs coefficients qui ne sont pas affectées par 
certaines transformations. Le concept d'invariant, sous- 
jacent à divers travaux de Lagrange, de Gauss, Cauchy, 
Jacobi, Eisenstein, est explicite, en 1841, chez Boole; 
le terme apparaît chez Sylvester (1814-1897) qui est, 
avec Cayley (1821-1895), l'auteur des fondements de 
la théorie des formes algébriques et des invariants. Signa- 
lons que Sylvester transmit le patrimoine mathématique 
européen aux États-Unis, où il fut professeur et fonda 
l'American Journal of Mathematics. 

La théorie des formes algébriques et des invariants, qui 
avait reçu une impulsion de l'étude analytique des pro- 
priétés projectives des courbes et des surfaces algé- 
briques, lui fournit en retour un langage commode et 
une méthode analytique de découverte. Alfred Clebsch 
(1833-1872), fondateur (avec Carl Gottfried Neumann) 
des Mathematische Annalen (1868), créa, avec Siegfried 
Aronhold (1819-1884), une symbolique nouvelle qui 
conduisit à l'algèbre tensorielle. Clebsch applique la 
théorie des invariants à des questions de géométrie pro- 
jective. Son utilité fut grande, également, en théorie des 
nombres, des équations différentielles et aux dérivées 
partielles; Lie et Klein en firent ressortir les liens avec la 
théorie des groupes. Hilbert, enfin, dans l'un de ses 
premiers travaux (1890), réussit à en dégager les lois 
fondamentales d'une façon particulièrement concise et 
élégante, en étendant le théorème de finitude aux formes 
algébriques à n variables. 


Quaternions et vecteurs 

Après que Gauss eut justifié l'existence des nombres 
complexes en en donnant une interprétation géométrique, 
on tenta de définir des nombres complexes de type 
ai + bj + ck, mais on s’aperçut qu'on ne pouvait définir 
de façon univoque une multiplication pour de telles 


sommes de trois facteurs. W. R. Hamilton (1805-1865) 
et H. Grassmann (1809-1877) inventèrent, le premier 
les « quaternions », le second les « grandeurs extensives » 
dont le rôle fut décisif dans le développement du calcul 
vectoriel et du calcul tensoriel. 

Hamilton publia en 1835 sa Theory of Algebraic 
Couples qui contient une représentation algébrique des 
nombres complexes comme couples (ordonnés) de 
nombres réels : 
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La multiplication, ainsi définie : 

(a, b): (c, d) — (ac — bd, ad — bc), redonne l'égalité 
i2 = — 1, quand on donne à a et à c la valeur O, et à bet 
à d la valeur 1. Les « quaternions », que Hamilton découvre 
dès 1843, apparaissent dans les Lectures on Quaternions 
(1853) et dans les F/ements of Quaternions (ouvrage 
posthume), sous la forme : é + x + jy + zk, où t'est la par- 
tie scalaire, et ix + jy + zk la partie vectorielle. Les 
quaternions sont avec les nombres complexes les seuls 
systèmes de nombres à coefficients réels sur lesquels la 
multiplication est associative et la division possible. 

En 1844, H. Grassmann publia Die lineale Ausdeh- 
nungslehre, ein neuer Zweig der Mathematik, où il 
introduisit ses « grandeurs extensives » d'une façon plus 
générale que n'avait fait Hamilton pour les quaternions; 
en effet, il se place d'emblée dans un espace à n dimen- 
sions en définissant un vecteur par la formule 

n 
V:= F3 xin: et distingue le produit scalaire (intérieur) 
isl 
du produit vectoriel (extérieur), ce dernier n'étant pas 
commutatif. L'ouvrage de Grassmann, d'un abord dif- 
ficile, ne suscita de l'intérêt que lorsque W. G. Hankel 
(1867) et Schlegel (1872-75) en eurent donné une 
présentation plus claire. 

Quaternions de Hamilton et « grandeurs extensives » 
de Grassmann correspondent à des extensions du 
concept de nombre et entraînent un élargissement de 
la notion d'algèbre, qui devient, pour une part, l'étude 
abstraite des lois de composition régissant les éléments 
d'un système de nombres. La notion générale de loi de 
composition s'était dégagée de travaux de Gauss sur 
certaines formes quadratiques, de la théorie des groupes 
de substitution, et des travaux d'algèbre abstraite et de 
logique symbolique de l'école anglaise. (Nous laissons 
de côté la contribution de la logique au développement 
des mathématiques au XIXe siècle; pour l'histoire de la 
logique, voir le chapitre qui lui est consacré en particulier. 
Nous profitons de cette occasion pour dire que nous 
laisserons également de côté l'histoire du calcul des 
probabilités et des statistiques qui est évoquée dans le 
chapitre Mathématiques et société). La découverte du 
calcul matriciel, du calcul géométrique de Grassmann, 
celle des notions de corps de nombres et d'idéal exigeaient 
une refonte des conceptions de base et l'étude des 
divers types d'algèbres. C'est l'Américain B. Peirce (1809- 
1880) qui amorce cette refonte. Les travaux de B. Peirce, 
Linear Associative Algebra (1881), furent poursuivis 
par Cayley, Sylvester, C. S. Peirce (1839-1914), Dede- 
kind, Study, Cartan, etc. 


Les géométries 


Au début du XIX® siècle, sous l'influence de Monge, 
une partie de l’école mathématique française s'appliqua 
à l'étude des diverses branches de la géométrie. De 
France, ce renouveau gagna les autres pays d'Europe, 
prenant des formes variées et réagissant diversement au 
développement parallèle de l'algèbre et de l'analyse. 


La géométrie synthétique 

Essor rapide de la géométrie projective, introduction 
des transformations géométriques marquent le dévelop- 
pement très brillant de la géométrie synthétique ou pure 
dans la première moitié du XIX® siècle. La Géométrie 
descriptive de Monge a un rôle initiateur dans ce déve- 
loppement, et les Annales de Gergonne constituent un 
intéressant organe de liaison. 

Jean-Victor Poncelet (1788-1867), ancien élève 
de l'École polytechnique, définit, dans son Traité des 
propriétés projectives des figures, la géométrie projec- 
tive comme l'étude des propriétés invariantes par pro- 
jection centrale ou perspective. Ses méthodes sont 
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l'emploi généralisé de la perspective et des sections 
planes, l'introduction systématique des éléments im- 
propres ou idéaux que Lazare Carnot avait déjà utilisés 
dans sa Géométrie de position (1803) pour définir le 
plan projectif à partir du plan affine par adjonction des 
éléments idéaux (à l'infini). La transformation par 
polaires réciproques, ou polaire, que Poncelet introduit 
est généralisée sous le nom de corrélation; la symétrie 
entre point et droite qui y apparaît trouve une forme plus 
générale dans le principe de « dualité », dont Poncelet, 
Gergonne, Chasles, Môbius, Plücker précisent la signi- 
fication, et dont l'origine se trouve dans le théorème de 
Desargues selon lequel les droites prolongeant les côtés 
de deux triangles placés en perspective dans le même 
plan se coupent sur la même droite (fig. 16). 

L'emploi que fit Poncelet des transformations géomé- 
triques projection cylindrique ou centrale, homo- 
logie, polarité, dans le but de réduire certaines propriétés 
à des cas plus simples, par exemple réduire les propriétés 
des coniques à celles du cercle, stimula l'étude des 
diverses sortes de transformations. 

Dans sa Systematische Entwicklung (1832), Steiner 
définit dans l’espace projectif 6 formes fondamentales 
classées en 3 espèces et montre que l'on peut passer 
d'une forme à l’autre de la même espèce, pourvu qu'une 
condition « de projectivité », dont C. von Staudt (1847) 
donnera la forme générale, soit remplie. À partir de ces 
formes, Steiner systématise les méthodes de génération 
projective des figures déjà antérieurement employées 
dans des cas particuliers. 

Chasles (1793-1880), qui devanca Steiner sur certains 
points, contribua à la diffusion de ces méthodes. Outre 
de nombreux mémoires, on lui doit l'Apercu historique 
sur l'origine et le développement des méthodes géomé- 
triques (1837), remarquable tableau de l'histoire de la 
géométrie, et deux traités sur les principes de la géométrie 
projective : Traité de géométrie supérieure et Traité des 
sections coniques (1852). 

Staudt (1798-1867) réussit une axiomatisation de la 
géométrie projective, qui la débarrassa des défauts qui 
l'empêchaient d'être une discipline entièrement auto- 
nome : usage de notions métriques dans la définition 
d'éléments projectifs, justification insuffisante des élé- 
ments imaginaires, recours déguisé à la méthode des 
coordonnées, lourdeur de certaines démonstrations. 
Staudt s'efforça, en effet, de reconstituer l'ensemble de 
la discipline indépendamment des notions métriques 
d'angle et de distance, à l'aide des seuls axiomes concer- 
nant l'ordre et la position des éléments fondamentaux. 
Se limitant au domaine réel dans sa Geometrie der 
Lage (1847), il définit dans ses Beiträge zur Geometrie 


303 


À Lazare Carnot 
(1753-1823) ; dans 

sa Géométrie de position 
(1803), il est, avec Monge, 
l'un des créateurs 

de la géométrie moderne. 


Y A gauche, figure 16 : 
application du théorème 
de Desargues. 

À droite, le mathématicien 
et géomètre français 
Michel Chasles 
(1793-1880). 


Roger Viollet 


À Le géomètre italien 
Luigi Cremona (7830-1903). 


Palais de la Découverte - Paris 


der Lage (1856-1860) les éléments imaginaires comme 
éléments doubles d'involutions elliptiques et montre 
qu'ils satisfont aux axiomes fondamentaux. 

Vers 1870, Klein montre la nécessité d’adjoindre aux 
axiomes celui de continuité; il prouve l'indépendance 
de la géométrie projective par rapport à l'axiome des 
parallèles, constate l'indémontrabilité du théorème des 
triangles homologiques de Desargues et du théorème 
de l’hexagramme de Pascal, étend la géométrie projective 
aux espaces à » dimensions. 

La fin du siècle apporte le déclin de la géométrie syn- 
thétique au profit de sa rivale, la géométrie analytique, 
qui avait tiré parti des progrès de l'algèbre linéaire. De 
nombreux géomètres abandonnèrent le point de vue 
exclusif d'une géométrie pure, totalement autonome, 
sans craindre de profiter des ressources de l'algèbre et 
de l'analyse. 


Les géométries non euclidiennes - Les fondements 
de la géométrie 

Les efforts de Saccheri et de Lambert, au XVIII siècle, 
pour approfondir la signification du fameux postulat des 
parallèles avaient montré trois voies possibles : la voie 
classique fondée sur l'acceptation du postulat ou d’un 
équivalent; les deux autres fondées, de manières oppo- 
sées, sur son rejet. Saccheri avait finalement conclu à 
l'absurdité de ces dernières hypothèses, tandis que 
Lambert, plus prudent, avait montré qu'elles se vérifient 
pour les figures placées sur une sphère. Dès 1792, Gauss 
réfléchit au problème posé par le 5° postulat, et continue 
de s'y intéresser toute sa vie sans rien publier. En 1799, 
il affirme posséder les principes d'une géométrie nou- 
velle, fondée sur l'existence d'une infinité de parallèles 
pouvant être menées par un point extérieur à une droite: 
il apprécie favorablement les idées de F. K. Schweikart 
(1819) et de Taurinus (1825-1826) qui vont dans le 
sens d’une géométrie non euclidienne. 

Nicolas I. Lobatchevski (1792-1856), de l'université 
de Kazan, et Jänos Bolyai (1802-1860), de Vienne, 
découvrent également, et indépendamment l'un de 
l'autre, la géométrie hyperbolique dont Gauss avait eu 
l'idée. Le 5° postulat est remplacé par la possibilité de 
mener, par un point extérieur à une droite, plusieurs 
parallèles à cette droite, si bien que la somme des angles 
d'un triangle rectiligne est inférieure à deux droits. 
L'originalité de Lobatchevski ne fut pas reconnue de son 
vivant; Gauss, qui pouvait apprécier les exposés que 
l'auteur fit de ses travaux, dans le Journal de Crelle 
d'abord (Géométrie imaginaire), puis dans une publi- 
cation berlinoise (Geometrische Untersuchungen zur 
Theorie der Parallellinien - 1840), n'exprima pas publi- 
quement son approbation. De même, à Bolyai qui lui 
avait fait adresser son travail par l'intermédiaire de son 
père, disciple du grand mathématicien, Gauss marqua 
son intérêt en signalant qu'il avait lui-même depuis 
longtemps rencontré les mêmes idées. Bolyai, découragé, 
garda désormais le silence. Ce qui explique que cette 
géométrie resta inconnue dans ce premier temps. 

Mais, en 1868, Bernhard Riemann (1826-1868) publie 
la thèse qu'il avait soutenue en 1854 : c'est le fameux 
mémoire intitulé : Über die Hypothesen, welche der 
Geometrie zu Grunde liegen, où il introduit des espaces 
très généraux par la donnée du carré de l'élément linéaire 
ds? et évoque le second type de géométrie non eucli- 
dienne, la géométrie « elliptique », qui nie l'infinitude de 
la droite et affirme que par un point extérieur à une droite 
il ne passe aucune parallèle à cette droite : le plan pro- 
jectif ou la surface d'une sphère donnent des « modèles » 
de cette géométrie qui acquerra une grande importance 
en physique, avec la théorie de la relativité. 

Les développements des géométries non euclidiennes 
furent ensuite fonction des travaux sur les espaces 
abstraits, des progrès de la théorie des groupes et de la 
naissance de la topologie. En 1871, Klein utilise la 
métrique définie par Cayley pour faire ressortir la struc- 
ture d'ensemble des disciplines géométriques et inter- 
préter la tripartition en géométrie parabolique (eucli- 
dienne), hyperbolique et elliptique. La connaissance qu'il 
avait de la théorie des invariants et de la théorie des 
groupes conduisit Klein à une belle synthèse. Dans sa 
célèbre dissertation de 1872, connue sous le nom de 
Programme d'Erlangen, il caractérise les différents théo- 
rèmes de géométrie et les diverses directions de re- 
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cherches par les groupes de transformations qui leur 
correspondent. Chaque géométrie étant la théorie des 
invariants d'un groupe de transformations donné, les 
deux courants « synthétique » et « analytique » se révèlent 
identiques malgré la différence des langages ; la géométrie 
euclidienne est l'étude des invariants du groupe métrique, 
la géométrie projective celle des invariants du groupe 
linéaire, la topologie celle des invariants du groupe des 
transformations ponctuelles continues. Le Programme 
d'Erlangen eut un grand succès et influa sur les différents 
domaines de la géométrie. 

La diffusion des géométries non euclidiennes vint 
renforcer, durant la seconde moitié du XIXe siècle, l'effet 
produit par l'examen critique des fondements de l’ana- 
lyse et les préoccupations axiomatiques en arithmétique 
(que nous évoquerons plus loin). Il se développa une 
analyse critique des principes de la géométrie classique : 
on explicita certains postulats implicitement admis 
postulat d'Archimède mis en évidence par Stolz (et 
d'une certaine façon aussi par Bolzano dans des écrits 
qui voient le jour seulement en 1975), postulat de la 
continuité énoncé par Cantor et Dedekind, postulats 
d'ordre signalés par Gauss, Grassmann et Pasch, lequel 
mit l'accent sur les concepts primitifs qui permettent 
l'énoncé des propositions fondamentales (postulats) 
à partir desquelles se démontrent les autres propositions 
(théorèmes ). 

En 1899, David Hilbert présenta une remarquable syn- 
thèse des travaux antérieurs et de ses propres recherches 
sur les fondements de la géométrie. Évitant le recours 
aux images concrètes, les Grundlagen der Geometrie, 
qui connurent rapidement plusieurs éditions (1899, 1903, 
1909, etc.), introduisent trois systèmes de choses appelés 
points, droites et plans. Ces objets, dont la nature n'est 
pas précisée, entretiennent certaines relations, exprimées 
par 21 axiomes, classés en 5 groupes : axiomes d'appar- 
tenance, axiomes d'ordre, axiomes d'égalité ou de 
congruence, axiomes des parallèles et axiomes de 
continuité. Attentif à l'indépendance et à la non-contra- 
diction de ces axiomes, Hilbert pense qu'ils constituent 
le minimum suffisant pour reconstruire tout l'édifice 
géométrique, à l'aide des seules règles de la logique et 
de l'arithmétique. Les Grundlagen marquent le point 
de départ des travaux axiomatiques dont l'importance 
sera un des traits essentiels de la mathématique du 
XXE siècle. 


Le renouveau de la géométrie analytique 

Il est marqué successivement par la prépondérance de 
l'école française de Monge, le rôle de Plücker, l'inter- 
vention de l'algèbre linéaire, l'introduction de la géométrie 
des droites et des espaces à n dimensions, l'essor parallèle 
de la géométrie algébrique et de la géométrie diffé- 
rentielle. 

L'expression « géométrie analytique », introduite par 
Lacroix en 1797, fut utilisée pour la première fois dans 
le titre d'un ouvrage de Lefrançois en 1804. L'inscription 
de cette discipline dans les programmes de l'École 
polytechnique suscita un certain nombre de publications. 
Mais c'est l'école allemande qui se distingue particulière- 
ment. Plücker dans ses Analytisch-geometrische Entwick- 
lungen (2 tomes, Essen, 1828 et 1831) montre que, par 
l'emploi de la notation abrégée et des nouveaux sys- 
tèmes de coordonnées, la géométrie analytique écarte les 
difficultés des calculs d'élimination et aboutit aux mêmes 
résultats que la géométrie pure. C'est ainsi que Plücker 
aboutit analytiquement au principe de dualité, précise 
les concepts d’'équation et de coordonnées tangentielles, 
celui de classe d'une courbe, introduits par Môbius et 
Poncelet. Son System der analytischen Geometrie 
reprend l'étude et la classification des courbes algé- 
briques, délaissées depuis le XVIIIe siècle ; c'est dans cette 
étude qu'il introduit un principe nouveau : l'énuméra- 
tion des constantes, qui repose sur les célèbres for- 
mules de Plücker reliant l'ordre, la classe et les nombres 
des différents types de singularités (points doubles, de 
rebroussement, tangentes d'inflexion, tangentes sta- 
tionnaires) d'une courbe de type donné. 

O. Hesse (1811-1874) utilisa les déterminants et 
appliqua la théorie des formes algébriques et des inva- 
riants pour une présentation simple et élégante des 
résultats de Plücker; il établit l’équivalence entre la 
théorie des équations algébriques et celle des courbes 


et des surfaces, donne sa forme définitive à la notation 
des coordonnées homogènes et introduit l'emploi du 
« hessien ». 

En Angleterre, Cayley utilisa très largement l'algèbre 
linéaire dans ses études sur les transformations de coor- 
données, sur les quadriques et les surfaces du 4® ordre; il 
généralisa les résultats de Plücker aux courbes algé- 
briques de l'espace et aux surfaces algébriques. 

L'étude des transformations projectives et des divers 
systèmes de coordonnées ponctuelles ou tangentielles 
dans l’espace à trois dimensions montra, en même temps 
que la symétrie des rôles joués par les points et les 
droites (ou les plans), la nécessité de considérer une droite 
tantôt comme rayon décrit par un point, tantôt comme axe 
autour duquel tourne un plan. Aucun des systèmes de 
coordonnées connus ne convenant à cette conception 
dualiste, Plücker conçut (en 1865) le système des 
coordonnées « plückériennes » (six coordonnées homo- 
gènes, /, m, n, à, u, v, liées entre elles par la relation 
bilinéaire / À + mu + nv— 0) pour caractériser une 
droite. L'originalité de cette nouvelle notation invita de 
nombreux mathématiciens à poursuivre l'étude de la 
géométrie des droites, ou géométrie réglée, et à la mettre 
en rapport avec celle de certaines équations aux dérivées 
partielles, de l'optique géométrique et de l'analyse 
vectorielle. 


Les débuts de la géométrie algébrique 

La convergence des divers travaux de géométrie re- 
nouvela, dans la seconde moitié du XIX® siècle, l'étude 
des courbes et des surfaces algébriques, et déboucha sur 
la création d'une nouvelle discipline : la géométrie algé- 
brique, liée à la fois à la géométrie synthétique et ana- 
lytique, à l'algèbre linéaire et générale et à la théorie des 
fonctions. 

Au XVIIIe siècle, Maclaurin avait dégagé la notion de 
courbe unicursale, c'est-à-dire courbe telle que les 
coordonnées de son point courant sont exprimables en 
fonctions rationnelles d'un paramètre. Une courbe uni- 
cursale est une courbe algébrique plane qui possède le 
nombre maximal N = (7—1) (n—2)/2 de points doubles 
compatible avec son degré n : conique, cubique à un 
point double, quartique à 3 points doubles, etc. 

Le théorème d'Abel (1829) sur les intégrales abéliennes 
éclaira cette notion en associant à chaque courbe algé- 
brique un nombre entier p = N—N”, N° étant le nombre 
effectif de points doubles; les courbes unicursales ont 
donc un nombre — 0, ou sont de genre 0. Riemann 
renouvela la question en 1851 en introduisant la surface, 
dite de Riemann, associée à toute courbe algébrique 
plane. Clebsch et Poincaré complétèrent les résultats de 
Riemann. 

Après la redécouverte de l'inversion (par Môbius, en 
particulier) et l'étude des transformations quadratiques 
(par Magnus, 1832), Jonquières donne (en 1858) le 
premier exemple de transformation birationnelle d'ordre 
quelconque, dont la théorie est édifiée par le géomètre 
italien Cremona (en 1863). Après quoi, on pourra conce- 
voir les transformations birationnelles comme corres- 
pondances bijectives entre deux variétés algébriques 
plongées dans un espace projectif à un nombre quel- 
conque de dimensions. La théorie des groupes permit de 
voir que les transformations birationnelles constituent 
le groupe principal de la géométrie algébrique. 

L'étude des branches d'une courbe algébrique au 
voisinage d'un point singulier, qui constitue le centre de 
la géométrie algébrique, reprise par Puiseux (1850) 
et développée à la lumière des travaux de Riemann et 
de Cremona, par Noether en particulier, reçut un fonde- 
ment avec le mémoire de Brill et M. Noether : Über die 
algebraischen Funktionen und ihre Anwendung in der 
Geometrie, publié dans les Mathematische Annalen, en 
1874. 


La géométrie infinitésimale et différentielle 

La géométrie infinitésimale classique se transforme, 
au cours de ce siècle, en géométrie différentielle. Trois 
grands mathématiciens œuvrent à cette transformation : 
Monge, Gauss et Riemann. 

En France, au début du siècle, Monge est le maître 
de l'école de géométrie infinitésimale, et son influence 
persistera, à travers ses élèves de l'École polytechnique, 
jusqu'à la fin du siècle, marquant encore des géomètres 


aussi importants que Klein, Lie ou Darboux. Le principal 
disciple de Monge, en cette matière, est Charles Dupin 
(1784-1873) qui publie Développements de géométrie 
(1813), puis Applications de géométrie et de mécanique 
(1822). Dupin introduit notamment l'indicatrice qui 
permet de représenter simplement la variation des rayons 
de courbure des sections normales en un point à une 
surface. 

Préoccupé par divers problèmes théoriques d'astro- 
nomie, de géodésie et de cartographie (par exemple, 
celui de la représentation conforme d'une surface sur 
une autre), Gauss publie, en 1827, ses Disquisitiones 
circa generales superficies curvas, qui marquent un pas 
en avant par rapport à l'œuvre de Monge. Gauss introduit 
les coordonnées curvilignes w et v sur une surface S et 
donne une expression différentielle au carré de l'élément 
linéaire : ds? = E du? + 2 F du dv + G d?où E,F et G 
sont des fonctions de u et de v. Il montre que les proprié- 
tés locales de S ne dépendent pas du fait qu'elle est 
placée dans l’espace euclidien, mais seulement de l'élé- 
ment linéaire ds. En particulier, la courbure totale en un 
point dépend uniquement de E, F et G, et de leurs déri- 
vées, et demeure invariante dans les déformations des 
surfaces flexibles et inextensibles : c'est le « theorema 
egregium ». 

Sous la triple influence de Monge, Gauss et Jacobi, 
d'importants travaux voient le jour, à partir de 1840, dans 
le Journal de mathématiques pures et appliquées de 
Liouville. C'est alors que Riemann renouvelle considé- 
rablement les principes de la discipline. Dans sa fameuse 
dissertation de 1854, il aborde l'étude des variétés topo- 
logiques à un nombre quelconque de dimensions, et défi- 
nit par une forme quadratique positive la distance de 
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Y Charles Dupin 
(1784-1873), économiste 
et mathématicien français, 
fut le principal disciple 

de Monge (reproduction 
d'un cliché de Nadar). 
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Riemann s'intéresse spécialement aux surfaces à cour- 
bure constante et montre comment elles permettent 
d'interpréter la géométrie non euclidienne plane. L'étude 
des géométries riemanniennes exigeait une théorie des 
formes différentielles quadratiques, dont Riemann lui- 
même amorça l'étude dans un mémoire posthume. 

Entre 1864 et 1868, le géomètre italien Beltrami montra, 
grâce à la théorie des invariants différentiels, les liens 
qui unissaient les conceptions de Gauss et de Lamé et 
celle de Riemann. Les recherches dans cette voie abou- 
tirent à l'analyse vectorielle et au calcul différentiel 
absolu. 

Après 1870, les progrès de la géométrie différentielle 
sont marqués, d'une part, par le rôle des premières consi- 
dérations topologiques, comme dans les mémoires de 
H. Poincaré Sur les courbes définies par une équation 
différentielle (1881-1886), qui étudient, sans intégration 
préalable, les propriétés des courbes intégrales d'équa- 
tions différentielles, et, d'autre part, par la théorie des 
groupes, comme dans les œuvres de Sophus Lie 
Theorie der Transformationsgruppen (1888-1893), Dif- 
ferentialgleichungen (1891), Kontinuerliche Gruppen 
(1893), Berührungstransformationen (1896). 

Darboux, dans les 4 volumes de ses Lecons sur la 
théorie générale des surfaces (1887-1896), fait une 
remarquable synthèse de tout l'apport du siècle. 


L'apparition de la topologie 

Préfigurée par l'Analysis situs de Leibniz, cette disci- 
pline s'’annonca par des problèmes célèbres, celui « des 
ponts de Saint-Pétersbourg » (Euler), celui des nœuds 
(Gauss, Listing), celui du coloriage (Môbius, de Morgan, 
Cayley, Tait), celui de la relation de Descartes-Euler 
entre les nombres de faces, d'arêtes et de sommets d'un 
polyèdre, avant de se préciser à travers les œuvres de 
Cayley, de Listing, de Môbius auquel on doit le premier 
exemple de surface unilatère (la bande de Môbius, 1858). 
C'est Riemann qui fonda cette science comme étude des 
propriétés invariantes par transformations bijectives 
continues. Les « surfaces de Riemann » font intervenir 
la topologie dans la théorie des fonctions de variables 
complexes et dans toute l'analyse (1857). Influencés 
par la création de la théorie des ensembles, la théorie des 
nombres réels et la théorie des fonctions de variables 
réelles, les travaux suivants portent sur les ensembles de 
points, sur les concepts de courbe et de domaine (Cantor, 
Jordan) et sur les ensembles de courbes et de fonctions. 


L'analyse classique 


Le développement de la physique mathématique 

Il est marqué par le travail déterminant de Joseph Fou- 
rier (1768-1830). Dans ses études sur la propagation de 
la chaleur, commencées en 1807, présentées à l'Acadé- 
mie des sciences en 1811 et publiées en 1822 dans la 
Théorie analytique de la chaleur, il exprime la loi de 
propagation par l'équation aux dérivées partielles 
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C'est en cherchant à intégrer cette équation que Fourier 
représente une fonction arbitraire par la série trigono- 
métrique qui porte, depuis, son nom : 
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Fourier donne les formules qui déterminent les coeffi- 
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posant ainsi les bases de la théorie que développera 
Dirichlet, et jouant un rôle décisif dans l’approfondisse- 
ment des concepts fondamentaux de l'analyse. 
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Le renouveau de l'analyse 

Bernard Bolzano, philosophe et mathématicien (1781- 
1848), eut une claire conscience de la nécessité de 
repenser avec rigueur les concepts et les définitions de 
base et de reconsidérer soigneusement les démonstra- 
tions pour asseoir l'analyse sur des principes irrépro- 
chables. Dès 1817, dans un mémoire consacré à la 
démonstration « purement analytique » d’un théorème 
important d'analyse (le titre complet est le suivant : 
Démonstration purement analytique du théorème : entre 
deux valeurs quelconques qui donnent deux résultats de 
signes opposés se trouve au moins une racine réelle de 
l'équation; ce mémoire, assez connu en Allemagne, 
fut traduit en français en 1964), il prend le soin de donner 
une définition correcte de la notion de continuité (iden- 
tique, à peu de chose près, à celle que nous avons héri- 
tée de Weierstrass, et plus rigoureuse, dans l'expression, 
que celle de Cauchy), en regrettant que tant de mathé- 
maticiens, « même réputés », n'aient encore à ce sujet 
que des concepts fort « indistincts ». Bolzano eut nombre 
d'idées très originales, comme celle d'avoir construit 
une fonction continue en tout point de son intervalle 
de définition, et cependant nulle part dérivable (cet 
exemple se trouve dans la Funksionenlehre éditée en 
1930), mais le caractère purement logique et abstrait 
de son style de travail annonce plutôt les considérations 
qui prévaudront à la fin du siècle (avec Frege ou Weier- 
strass notamment), et son isolement qui l'écarte des 
grands courants de recherches de son époque le prive du 
rayonnement qui lui eût permis de faire école. 

Le devant de la scène est donc tout entier occupé par 
À. Cauchy (1789-1857), élève (d'Ampère et de Poisson 
en particulier) et, plus tard, professeur à l'École poly- 
technique; en 1821, Cauchy publie le Cours d'analyse 
qu'il a fait à l'École, inaugurant une tradition à laquelle 
nous devons, ensuite, les traités de Camille Jordan 
(1882-1887), d'Émile Picard (1891-1896), d'Édouard 
Goursat (1902-1905). Les travaux de Cauchy portent sur 
l'analyse réelle et complexe ; à côté de découvertes origi- 
nales, notamment sur l'intégrale définie, ils contiennent 
beaucoup de résultats connus que Cauchy reformule plus 
rigoureusement, dans le cadre d’un exposé systématique. 
C'est par leur caractère de synthèse d'ensemble que les 
œuvres de Cauchy connurent une si large diffusion et 
infléchirent le cours de l'histoire. 

Dès ses premiers travaux sur les intégrales définies 
multiples, Cauchy remarque que l'ordre d'intégration 
n'est pas indifférent lorsque la fonction à intégrer devient 
infinie en des points intérieurs au domaine d'intégration 
et s'oriente Vers un retour à l'ancienne définition de 
l'intégrale comme somme d'infiniment petits, définition 
dominante au XVIIe siècle et antérieure à la contribution 
leibnizienne qui mit en avant, au XVIIIe siècle, l'inté- 
grale indéfinie. Dans le cours de 1821, il commence par 
élargir le concept de fonction numérique, en n'exigeant 
plus que la fonction soit définie par une expression 
algébrique unique, sans en donner toutefois un énoncé 
purement analytique. Mais la définition de la continuité 
d'une fonction contenue dans ce cours reste fortement 
imprégnée de géométrie. 

C'est dans le résumé des Lecons sur le calcul infinitési- 
mal (1823) que Cauchy donne sa nouvelle définition de 
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limite de la somme 


l'intégrale f(x) dx comme 


n—1 4 
> (Xi +1— xi) f (Xi), avec x0o = a, xn = b lorsque les 
i=0 

intervalles (x;:1—Xx;) tendent vers zéro. Cette défi- 
nition, étendue et généralisée par Riemann dans son 
mémoire de 1854 : Über die Darstellbarkeït einer Funktion 
durch eine trigonometrische Reïihe, est identifiée aujour- 
d'hui sous le nom d’ « intégrale de Riemann », bien 
qu'elle n’acquière son aspect définitif qu'avec l'exposé 
de Darboux (1875). Stieltjes (1894) et Henri Lebesgue 
(1902) donnèrent à cette notion d'intégrale définie 
une nouvelle extension. 

Cauchy est resté également célèbre pour avoir donné 
plus de précision et de rigueur au concept de convergence 
d'une série; comme il s’en explique dans la Préface du 
Cours de 1821 en des termes exemplaires, il détermina 
avec soin, « avant d'effectuer la sommation d'aucune 
série », les conditions générales de convergence des 


séries, en établissant des critères dont le plus important 
est le fameux « critère de Cauchy » (en réalité également 
énoncé par Bolzano en 1817). A la suite de Cauchy, Abel 
et Raabe (1832), Duhamel (1839), Morgan et J. Ber- 
trand (1842), O. Bonnet (1843), Kummer (1835), 
Dini (1867), enfin P. du Bois-Reymond (1873) défi- 
nissent des critères de convergence de plus en plus 
fins. Pour les séries à termes de signes quelconques, 
Cauchy montre que, si une série est absolument conver- 
gente, alors elle est convergente et, complète Dirichlet 
en 1837, sa somme est indépendante de l'ordre de ses 
termes; Riemann, Abel, Dedekind, Kronecker, Weier- 
strass étudient également les séries non absolument 
convergentes. || faut noter cependant que Cauchy ne fait 
pas encore la distinction entre « convergence simple » 
et « convergence uniforme », dont Stockes et Dirichlet 
auront une idée vers 1840. 

Cauchy est, enfin et surtout, l'un des créateurs de la 
théorie des fonctions de variable complexe. Tandis 
qu'en 1821, le nombre complexe n'est pour lui qu'une 
« expression symbolique », il adopte, en 1825, dans son 
mémoire Sur les intégrales définies prises entre des 
limites imaginaires, la représentation de Gauss qui fait 
correspondre un point du plan à tout nombre complexe, 
puis, en 1849, il se rallie au point de vue de Wessel, 
d'Argand, de Warren, et légitime les opérations sur les 
complexes en les ramenant à des transformations du plan: 
déplacements et similitudes. 

Malgré une bonne connaissance des fonctions loga- 
rithmique et exponentielle, le XVIII siècle n'avait pas 
fait d'étude systématique des fonctions de variable 
complexe. En 1825, Cauchy découvre que, pour une 


fonction définie et continue, l'intégrale | 
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dépend pas du chemin le long duquel se fait l'intégration, 
et que, le long d’une courbe fermée sans point singulier, 
l'intégrale est nulle; s'il y a à l'intérieur du contour un 
point singulier, elle est égale à 27 /R,R étant le résidu 
en ce point. 

Parallèlement se perfectionne la théorie des fonctions 
elliptiques, principalement avec Le Gendre (7raité des 
fonctions elliptiques et des intégrales eulériennes, 
3 volumes de 1825 à 1832), Gauss qui ne publie rien, 
Abel et Jacobi qui s'aperçoivent de la nécessité de tra- 
vailler dans tout le domaine de la variable complexe et 
d'inverser le problème en s'intéressant, non à l'intégrale 
elle-même, mais à la fonction inverse, de même qu'il est 
plus commode d'étudier la fonction tg x au lieu de l'inté- 


grale F | a Abel découvre par ailleurs (en 1828) la 
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propriété fondamentale des intégrales dites « abéliennes ». 
Jacobi rassemble ses résultats dans les Fundamenta 
nova theoriae functionum  ellipticarum (1829) qui 
imposent un vocabulaire repris par Hermite et Poincaré. 

Le XVIIIe siècle avait inauguré l'étude des équations 
différentielles et aux dérivées partielles. Cauchy établit 
le premier théorème d'existence d'une solution pour 
une équation différentielle donnée, par une méthode 
encore en usage aujourd'hui : elle consiste à remplacer 
l'équation différentielle par une équation aux différences 
finies, dont on fait tendre ensuite les « pas » vers zéro. 
En 1868, Lipschitz retrouve cette méthode en en préci- 
sant les conditions d'application, dites conditions 
« lipschitziennes ». Une seconde méthode, également 
due à Cauchy, et retrouvée dans toute sa généralité 
par E. Picard en 1890, est celle des « fonctions majo- 
rantes », qui repose sur le développement en série des 
fonctions analytiques; Cauchy a démontré la conver- 
gence des séries entières exprimant les solutions d'un 
système d'équations différentielles, ce que Darboux et 
Sophia Kowalevskaïa retrouvent plus tard par une voie 
plus élégante. Quant aux méthodes d'intégration de ces 
équations, c'est le géomètre Sophus Lie qui met de 
l'ordre dans la profusion des résultats obtenus par 
Cauchy, Jacobi, Clebsch, Liouville, grâce à sa théorie 
des groupes continus de transformations qui permet 
et d'unifier sous un seul principe les méthodes clas- 
siques, et de déduire de la nature du groupe supposé 
connu des résultats précis sur la nature des systèmes 
auxiliaires intervenant dans l'intégration. 


Les travaux de Riemann et de Weierstrass 

Ces deux noms dominent toute la seconde moitié du 
XIX® siècle et, par des méthodes différentes et complé- 
mentaires, impriment à la théorie des fonctions analy- 
tiques sa forme classique. 

Bernhard Riemann (1826-1866), un des mathémati- 
ciens les plus profonds, fut l'élève de Gauss à Gôttingen, 
puis de Jacobi et de Dirichlet à Berlin. En 1859, il succède 
à Dirichlet dans la chaire de Gauss à Gôttingen, après 
avoir soutenu sa thèse en 1851. Celle-ci, Grundlagen für 
eine allgemeine Theorie der Funktionen einer veränderli- 
chen komplexen Grüsse, est fondamentale. Tout à fait 
indépendante des idées de Cauchy, elle s'inspire de la 
physique mathématique et de la géométrie et nous 
montre Riemann en disciple de Gauss, dont l'œuvre 
plus soignée que celle de Cauchy et cependant moins 
connue du grand public mathématique fut déterminante 
pour le progrès ultérieur de la physique et des mathé- 
matiques. 

La théorie du potentiel, commencée au XVIIIe siècle, 
est surtout développée au XIX° siècle; l'expression 
même est introduite par Green qui montre, en 1843, 
l'invariance de l'équation de Laplace par rapport à son 
inversion. Riemann s'intéresse à cette théorie, guidé 
probablement par l'enseignement de Gauss qui avait 
beaucoup travaillé la question. Riemann résout le pro- 
blème dit « de Dirichlet » : déterminer une intégrale par 
ses valeurs sur un contour fermé, en appliquant le « prin- 
cipe de Dirichlet », qu'avaient utilisé aussi bien Gauss 
que Jacobi. Après une objection de Weierstrass et les 
recherches de Schwarz, C. G. Neumann et Poincaré, 
Hilbert démontre en 1900 qu'on peut apporter la rigueur 
voulue à la démonstration de Riemann. 

Le caractère topologique des méthodes de Riemann 
se marque davantage dans sa 7heorie der Abelschen 
Funktionen (1857), qui fonde véritablement la théorie 
des fonctions algébriques, en introduisant les « surfaces 
de Riemann », formées de plans superposés, en nombre 
égal au degré d'une équation algébrique et reliés par 
des lignes de passage joignant les points critiques. L'in- 
fluence de Riemann fut grande et immédiate, en Alle- 
magne aussi bien qu'en France et en Italie. 

Karl Weierstrass (1815-1897) fut initié aux fonctions 
elliptiques par Gudermann qui l'incita à se fonder sur les 
développements en séries entières. Après de longues 
années passées dans l’enseignement secondaire, on le 
retrouve en 1856 professeur à l'université de Berlin, où 
ses cours connurent beaucoup de succès. Comme il 
publiait peu, ses idées sont répandues par les notes de ses 
élèves. Ses méthodes eurent une influence si profonde 
et si durable que son nom évoque une coupure, le tour- 
nant décisif par lequel l'analyse classique a gagné son 
équilibre définitif contre les ambiguïtés de l'ancien calcul 
infinitésimal et que nous désignons, après F. Klein, par 
l'expression « arithmétisation de l'analyse ». Nul ne l'a 
reconnu peut-être de façon aussi complète que David 
Hilbert dans son très fameux article Sur l'infini : « En 
élucidant entre autres les notions de minimum, de fonc- 
tion, de dérivée, il a écarté les objections que soulevait 
encore le calcul infinitésimal, il a nettoyé celui-ci de 
toutes les idées confuses sur l'infiniment grand et l'infi- 
niment petit Si aujourd'hui, grâce aux méthodes qui 
reposent sur la notion de nombre irrationnel, ou plus géné- 
ralement sur celle de limite, il règne en analyse une har- 
monie et une certitude parfaites ; et si, dans les questions 
les plus compliquées de la théorie des équations diffé- 
rentielles et intégrales, malgré les combinaisons les plus 
hardies et les plus diverses de toutes les formes de 
passage à la limite, tous les résultats se trouvent en 
accord, nous le devons essentiellement à l'activité 
scientifique de Weierstrass. » 

Faisons brièvement le point des apports de Weierstrass. 
En analyse réelle, il a donc définitivement dissocié les 
concepts de continuité et de dérivabilité, en construisant 
un exemple fameux d'une fonction continue sur un seg- 
ment et cependant dérivable en aucun des points du 
segment; l'exemple que Bolzano avait construit bien 
avant ne commence lui-même à être connu que vers 
cette époque précisément; il dissocie de même les 
concepts de convergence simple et de convergence 
uniforme, définit et utilise comme nous le faisons encore 
aujourd'hui la valeur absolue d'un nombre. Mais par- 
dessus tout, sa théorie purement arithmétique des 
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nombres irrationnels lui permet de donner une définition 
rigoureuse de la continuité d'une fonction, celle que l'on 
enseigne encore aujourd'hui, et d'obtenir ainsi que 
l'arithmétique supplante définitivement la géométrie en 
analyse, ce que voulait précisément dire Klein en parlant 
d’ « arithmétisation de l'analyse ». 

Dans le domaine de l'analyse complexe, Weierstrass et, 
indépendamment de lui, Méray définissent la fonction 
par un développement en série entière au voisinage 
d'un point, et la déterminent ensuite de proche en proche, 
par un prolongement analytique; les « fonctions trans- 
cendantes entières » correspondent aux séries conver- 
gentes dans tout le plan, tandis qu'au voisinage d'un 
point singulier, une fonction uniforme peut s'approcher 
de n'importe quelle valeur fixée à l'avance. 

La théorie des fonctions elliptiques atteint, avec 
Weierstrass, son point culminant ; elle est aussitôt adoptée 
par Schwarz, successeur de Weierstrass à Berlin, Halphen 
dans son 7raité des fonctions elliptiques (1886-1891), et 
par C. Jordan dans son Cours d'analyse; la théorie des 
fonctions automorphes de Klein et de Poincaré et la 
solution du problème d'uniformisation lui doivent 
beaucoup. 


La théorie des nombres 


Au début du XIXe siècle, Adrien-Marie Le Gendre et 
surtout Gauss déterminent l'orientation des recherches 
en théorie des nombres. Le Gendre, dans les versions 
successives d’un Essai sur la théorie des nombres, s'appuie 
essentiellement sur la théorie des fractions continues dont 
Lagrange avait montré la fécondité. Plus fondamentales 
sont les Disquisitiones arithmeticae (1801) de Gauss, 
œuvre de jeunesse mais dont la rigueur est telle que, 
jusque vers le milieu du siècle, rien de comparable ne sera 
fait ni en théorie des fonctions ni en géométrie. Avec 
l'algèbre pure, cette théorie des nombres inaugure les 
mathématiques modernes telles que les conçoit le 
XX° siècle. 

Gauss introduit la notion capitale de congruence, 
extension de la notion d'égalité et premier exemple des 
classes d'équivalence dont on sait le rôle si important 
aujourd'hui. « Si un nombre a divise la différence des 
nombres b et c, b et c sont dits congrus suivant a, sinon 
incongrus. a s'appellera le module »; tels sont les termes 
propres de Gauss, qui poursuit : « Chacun des nombres b 
et c est dit résidu de l'autre dans le premier cas, et non 
résidu dans le second. » Gauss démontre rigoureusement 
la loi de réciprocité des résidus quadratiques, étudiée 
par Euler et Le Gendre. 

Gauss complète les recherches de Lagrange et de 
Le Gendre sur les formes quadratiques : (a, b, c) — 
ax? + bxy + cy?; il cherche à déterminer les nombres k 
représentables par une forme de ce type quand x et y 
sont premiers entre eux; toutes les formes d'un déter- 
minant donné b?— 4ac se distribuent par classes. Les 
méthodes de réduction des formes sont simplifiées par 
Dirichlet, tandis qu’en 1851, Hermite développe une autre 
méthode, celle de « réduction continue ». 

Fermat avait affirmé dans ses notes l'impossibilité de 
l'équation en nombres entiers x? + y? = z* pour n > 3 
et donnait la démonstration pour les cas n = 3, 4. 
Le Gendre et Dirichlet parviennent à le démontrer pour 
n=5 (1825) et Lamé pour n = 7 (1840). Or, Gauss, 
dans un travail de 1832, sur les résidus biquadratiques, 
montre que les lois élémentaires de l'arithmétique 
s'étendent aux entiers complexes de la forme a + bi, les 
« entiers de Gauss ». Kummer considère, plus générale- 
ment, des entiers : 40 + ar + ar? + … + a»-1 "71, où 
les a; sont des entiers relatifs et 7 une racine primitive 
de l'équation 7? = 1. Kummer arrive alors à démontrer le 
« grand théorème de Fermat » mais en ayant, à tort, 
généralisé la théorie classique de la décomposition en 
facteurs premiers à ses nouveaux nombres. Averti de 
son erreur par Dirichlet, il amende sa démonstration en 
inventant ses « nombres idéaux » qui donneront à 
Dedekind l'idée de sa théorie des idéaux, concept central 
dans l'étude des corps de nombres algébriques. 

Si le grand théorème de Fermat a orienté la théorie des 
nombres vers l'extension de la notion de nombre entier, 
en la mettant en rapport avec l'algèbre, d'autres pro- 
blèmes la tournent vers la théorie des fonctions analy- 
tiques ; ainsi le problème de la partition des nombres posé 
par Euler (qui fait appel aux séries entières), le problème 
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de la répartition asymptotique des nombres premiers 
étudié par Le Gendre, le problème de Waring : déterminer 
le nombre de représentations d'un nombre n comme 
somme de puissances k-ièmes positives, qui fait appel 
à la théorie des formes, etc. Ces problèmes font intervenir 
un certain type de fonctions analytiques dont la plus 
célèbre est la fonction zéta de Riemann. 

Pour achever, rappelons que c'est au XIX® siècle que 
se fit une dissociation précise entre nombres algébriques 
et nombres transcendants, c'est-à-dire qui ne peuvent être 
racines d'aucune équation algébrique à coefficients 
rationnels. En 1844, Liouville prouva de manière générale 
l'existence de nombres non algébriques; Hermite démon- 
tra la transcendance du nombre e en 1872, et Lindemann 
celle du nombre + en 1882. 


Conclusion 


Ainsi, le XIX® siècle est avant tout le siècle où les 
mathématiques explosent en multiples branches diversi- 
fiées et spécialisées. Gauss, Poincaré ou Hilbert sont les 
derniers génies universels, tandis que commence à croître 
la race des experts et la nécessité pour chacun de travailler 
sur un ensemble de problèmes souvent restreint et impli- 
quant un appareillage technique tel qu'il n’est que rare- 
ment accessible aux autres mathématiciens non spécia- 
listes. Cependant, en 1893, F. Klein pensait que les 
concepts de groupe, de transformation linéaire et d’inva- 
riant permettaient de compenser l'extrême division des 
disciplines mathématiques par l'accès à un point de vue 
beaucoup plus général et abstrait d'où l'on aperçoit ce 
que Bourbaki nommera plus tard, dans son article bien 
connu, « l'architecture des mathématiques ». 

Le XIX® siècle est, ensuite, le grand siècle de la rigueur, 
le XVIIIe ayant été sans doute celui de l'ingéniosité. 
En s'attachant à chercher des démonstrations même 
pour les résultats bien connus et en soumettant le 
concept de démonstration lui-même à l'examen, les 
mathématiciens du XIX® siècle retrouvent pour ainsi dire 
l'inspiration euclidienne. 

Nous avons essayé de montrer que ce phénomène a 
surgi au confluent d'efforts aussi divers que ceux de 
Bolzano, Cauchy, ou Hamilton dont les quaternions, en 
ne vérifiant pas la loi de commutativité, ont remis en 
question le caractère « naturel » ou « évident » des lois 
de l'arithmétique en général, et au croisement de concepts 
aussi significatifs que ceux de géométrie non euclidienne, 
de géométrie à n dimensions, de corps quelconque de 
nombres (complexes, hypercomplexes...), de fonctions 
pathologiques, qui conduisent à repenser à neuf l'idée 
de vérité des mathématiques. Du point de vue technique, 
peut-être est-ce la théorie des fonctions de variable 
complexe qui fut la création la plus féconde. Mais du 
point de vue théorique, la découverte des géométries non 
euclidiennes apporta un changement capital et décisif 
dans la conception qu'on se faisait de la nature des 
mathématiques. Si l'on rappelle encore une fois que 
c'est au XIX® siècle que les concepts de nombre irrationnel 
d'abord, de continuité d'une fonction, de dérivée, 
d'intégrale ont recu une définition rigoureuse, on recon- 
naîtra la composante principale de cette conception de la 
rigueur selon laquelle il fallait reconstruire toutes les 
mathématiques sur la base d'une construction rigoureuse 
des nombres. Ce qui a conduit certains (Frege ou Hilbert, 
par exemple) à réfléchir sur les fondements logiques des 
mathématiques, et nous avons là la deuxième composante 
qui s'épanouira dans une discipline alors naissante : la 
logique mathématique. Si la méthode axiomatique n'a 
pas encore imposé son point de vue sur la nature des 
concepts mathématiques, il n'est plus question pour 
le mathématicien, en tout cas, de « lire dans le grand 
livre de la Nature » : on a cessé de croire que les cons- 
tructions mathématiques ont nécessairement un homo- 
logue dans la réalité. Nous n'en donnerons pour confir- 
mation que ce texte de Gauss, le premier mathématicien 
du siècle, et un des plus grands, qui écrivait dès 1811, 
dans une lettre à Bessel (du 21 novembre), qu’ «on ne 
devrait jamais oublier que les fonctions, comme toutes 
les autres constructions mathématiques, ne sont que 
notre propre création, et que, lorsque la définition qu'on 
commence par donner cesse d’avoir un sens, on devrait 
non pas s'interroger sur ce qu'elle est, mais chercher 
ce qu'il est convenable d'admettre pour qu'elle garde 
son sens ». 


